系统功能测试问题研讨20250904

会议纪要:数据导入与 AI 分析会

会议信息

  • 会议时间 :2025年09月03日 11:43 - 11:58
  • 会议主题 :组织数据导入及 AI 分析讨论
  • 参会人员 :说话人A、说话人B(推测为朱晨、小关等相关人员)

一、数据现状与初步处理

1. 最新动态数据

  • 当前状态 :仅为 Demo 数据,尚未录入真实数据。
  • 后续安排 :朱晨将调用一次 AI 进行处理。

2. 资料隐藏处理

  • 处理内容 :小关将无数据的“11篇资料”部分隐藏。

3. 联系人搜索存储

  • 存储方式 :联系人搜索使用直接存入方式 ,不再使用以前的员工 ID。

4. 添加问题处理

  • 当前状态 :添加功能存在小问题。
  • 后续安排 :待反馈后再行处理。

二、导入组织数据情况

1. 联系人数据源

  • 原始数据 :从邮件备份数据库读取,包含两万多个联系人。
  • 清洗后数据 :去除推广邮件后,约剩一万个 有直接公司联系的联系人。

2. 导入流程

  • 信息提取 :从联系人中提取联系人信息组织信息
  • 导入结果 :最终导入约一万个联系人。

三、AI 分析相关内容

1. 分析数据基础

  • 数据来源 :为每个联系人提取与公司沟通的约 10 封邮件 作为上下文,供 AI 分析组织信息。

2. 分析对象信息

AI 将分析以下信息:

  • 联系人的昵称、邮箱、姓名、职位。
  • 所属公司名称、域名。
  • 关系类型。
  • 公司沟通人员。
  • 合作信息等。

3. 关系类型细分

  • 现状 :合作伙伴关系类型多样。
  • 计划 :可能增加字段以区分不同类型,例如:
    • 货代物流商
    • 技术服务
    • 咨询服务
    • 财务
    • 服务团队等

四、数据处理特殊要求

1. 增加过滤字段

  • 组织表调整 :增加“是否营销 ”列,用于过滤营销邮件信息。

2. 跟进策略设置

  • 重要性标签 :为组织打上重要性标签,以过滤出需要重点关注的信息。

五、数据处理流程与注意事项

1. 分工与流程

  • 格式处理 :说话人1处理对象格式,固定后由朱晨提取信息。
  • 临时表创建 :朱晨在数据库中创建临时表。

2. API 请求与优化

  • 请求方式 :读取每行数据,根据邮箱请求 API 获取分析结果。
  • 成本预估 :可能消耗 3 亿多 TOKEN
  • 优化方向 :需减少重复请求以控制成本。

3. 组织合并判断

  • 判重逻辑
    • 导入组织时判断组织是否已存在。
    • 若存在,则补充信息;若不存在,则创建新组织。
  • 特殊规则 :通用邮箱不作为组织判重条件,需在脚本中过滤。

六、后续工作安排

1. 接口与脚本开发

  • 接口提供 :说话人1晚些时候给出接口。
  • 脚本编写 :朱晨根据接口先编写脚本。

2. 调试与批量处理

  • 调试阶段 :先导入少量数据(几个)进行调试。
  • 批量运行 :调试通过后,再批量运行处理全部信息。

七、其他事项

1. 测试与问题反馈

  • 当前重点 :测试系统,查看是否存在 Bug。
  • 资料隐藏 :小关已处理无数据的“11篇资料”部分。