系统功能测试问题研讨20250904
会议纪要:数据导入与 AI 分析会
会议信息
- 会议时间 :2025年09月03日 11:43 - 11:58
- 会议主题 :组织数据导入及 AI 分析讨论
- 参会人员 :说话人A、说话人B(推测为朱晨、小关等相关人员)
一、数据现状与初步处理
1. 最新动态数据
- 当前状态 :仅为 Demo 数据,尚未录入真实数据。
- 后续安排 :朱晨将调用一次 AI 进行处理。
2. 资料隐藏处理
- 处理内容 :小关将无数据的“11篇资料”部分隐藏。
3. 联系人搜索存储
- 存储方式 :联系人搜索使用直接存入方式 ,不再使用以前的员工 ID。
4. 添加问题处理
- 当前状态 :添加功能存在小问题。
- 后续安排 :待反馈后再行处理。
二、导入组织数据情况
1. 联系人数据源
- 原始数据 :从邮件备份数据库读取,包含两万多个联系人。
- 清洗后数据 :去除推广邮件后,约剩一万个 有直接公司联系的联系人。
2. 导入流程
- 信息提取 :从联系人中提取联系人信息 与组织信息 。
- 导入结果 :最终导入约一万个联系人。
三、AI 分析相关内容
1. 分析数据基础
- 数据来源 :为每个联系人提取与公司沟通的约 10 封邮件 作为上下文,供 AI 分析组织信息。
2. 分析对象信息
AI 将分析以下信息:
- 联系人的昵称、邮箱、姓名、职位。
- 所属公司名称、域名。
- 关系类型。
- 公司沟通人员。
- 合作信息等。
3. 关系类型细分
- 现状 :合作伙伴关系类型多样。
- 计划 :可能增加字段以区分不同类型,例如:
- 货代物流商
- 技术服务
- 咨询服务
- 财务
- 服务团队等
四、数据处理特殊要求
1. 增加过滤字段
- 组织表调整 :增加“是否营销 ”列,用于过滤营销邮件信息。
2. 跟进策略设置
- 重要性标签 :为组织打上重要性标签,以过滤出需要重点关注的信息。
五、数据处理流程与注意事项
1. 分工与流程
- 格式处理 :说话人1处理对象格式,固定后由朱晨提取信息。
- 临时表创建 :朱晨在数据库中创建临时表。
2. API 请求与优化
- 请求方式 :读取每行数据,根据邮箱请求 API 获取分析结果。
- 成本预估 :可能消耗 3 亿多 TOKEN 。
- 优化方向 :需减少重复请求以控制成本。
3. 组织合并判断
- 判重逻辑 :
- 导入组织时判断组织是否已存在。
- 若存在,则补充信息;若不存在,则创建新组织。
- 特殊规则 :通用邮箱不作为组织判重条件,需在脚本中过滤。
六、后续工作安排
1. 接口与脚本开发
- 接口提供 :说话人1晚些时候给出接口。
- 脚本编写 :朱晨根据接口先编写脚本。
2. 调试与批量处理
- 调试阶段 :先导入少量数据(几个)进行调试。
- 批量运行 :调试通过后,再批量运行处理全部信息。
七、其他事项
1. 测试与问题反馈
- 当前重点 :测试系统,查看是否存在 Bug。
- 资料隐藏 :小关已处理无数据的“11篇资料”部分。