DieselChen

个人博客,记录一下学习的点滴~

0%

系统功能测试问题研讨20250904

会议纪要:数据导入与 AI 分析会

会议信息

  • 会议时间:2025年09月03日 11:43 - 11:58
  • 会议主题:组织数据导入及 AI 分析讨论
  • 参会人员:说话人A、说话人B(推测为朱晨、小关等相关人员)

一、数据现状与初步处理

1. 最新动态数据

  • 当前状态:仅为 Demo 数据,尚未录入真实数据。
  • 后续安排:朱晨将调用一次 AI 进行处理。

2. 资料隐藏处理

  • 处理内容:小关将无数据的“11篇资料”部分隐藏。

3. 联系人搜索存储

  • 存储方式:联系人搜索使用直接存入方式,不再使用以前的员工 ID。

4. 添加问题处理

  • 当前状态:添加功能存在小问题。
  • 后续安排:待反馈后再行处理。

二、导入组织数据情况

1. 联系人数据源

  • 原始数据:从邮件备份数据库读取,包含两万多个联系人。
  • 清洗后数据:去除推广邮件后,约剩一万个有直接公司联系的联系人。

2. 导入流程

  • 信息提取:从联系人中提取联系人信息组织信息
  • 导入结果:最终导入约一万个联系人。

三、AI 分析相关内容

1. 分析数据基础

  • 数据来源:为每个联系人提取与公司沟通的约 10 封邮件作为上下文,供 AI 分析组织信息。

2. 分析对象信息

AI 将分析以下信息:

  • 联系人的昵称、邮箱、姓名、职位。
  • 所属公司名称、域名。
  • 关系类型。
  • 公司沟通人员。
  • 合作信息等。

3. 关系类型细分

  • 现状:合作伙伴关系类型多样。
  • 计划:可能增加字段以区分不同类型,例如:
    • 货代物流商
    • 技术服务
    • 咨询服务
    • 财务
    • 服务团队等

四、数据处理特殊要求

1. 增加过滤字段

  • 组织表调整:增加“是否营销”列,用于过滤营销邮件信息。

2. 跟进策略设置

  • 重要性标签:为组织打上重要性标签,以过滤出需要重点关注的信息。

五、数据处理流程与注意事项

1. 分工与流程

  • 格式处理:说话人1处理对象格式,固定后由朱晨提取信息。
  • 临时表创建:朱晨在数据库中创建临时表。

2. API 请求与优化

  • 请求方式:读取每行数据,根据邮箱请求 API 获取分析结果。
  • 成本预估:可能消耗 3 亿多 TOKEN
  • 优化方向:需减少重复请求以控制成本。

3. 组织合并判断

  • 判重逻辑
    • 导入组织时判断组织是否已存在。
    • 若存在,则补充信息;若不存在,则创建新组织。
  • 特殊规则:通用邮箱不作为组织判重条件,需在脚本中过滤。

六、后续工作安排

1. 接口与脚本开发

  • 接口提供:说话人1晚些时候给出接口。
  • 脚本编写:朱晨根据接口先编写脚本。

2. 调试与批量处理

  • 调试阶段:先导入少量数据(几个)进行调试。
  • 批量运行:调试通过后,再批量运行处理全部信息。

七、其他事项

1. 测试与问题反馈

  • 当前重点:测试系统,查看是否存在 Bug。
  • 资料隐藏:小关已处理无数据的“11篇资料”部分。

欢迎关注我的其它发布渠道

-----------本文结束感谢您的阅读-----------