会议纪要:数据导入与 AI 分析会
会议信息
- 会议时间:2025年09月03日 11:43 - 11:58
- 会议主题:组织数据导入及 AI 分析讨论
- 参会人员:说话人A、说话人B(推测为朱晨、小关等相关人员)
一、数据现状与初步处理
1. 最新动态数据
- 当前状态:仅为 Demo 数据,尚未录入真实数据。
- 后续安排:朱晨将调用一次 AI 进行处理。
2. 资料隐藏处理
- 处理内容:小关将无数据的“11篇资料”部分隐藏。
3. 联系人搜索存储
- 存储方式:联系人搜索使用直接存入方式,不再使用以前的员工 ID。
4. 添加问题处理
- 当前状态:添加功能存在小问题。
- 后续安排:待反馈后再行处理。
二、导入组织数据情况
1. 联系人数据源
- 原始数据:从邮件备份数据库读取,包含两万多个联系人。
- 清洗后数据:去除推广邮件后,约剩一万个有直接公司联系的联系人。
2. 导入流程
- 信息提取:从联系人中提取联系人信息与组织信息。
- 导入结果:最终导入约一万个联系人。
三、AI 分析相关内容
1. 分析数据基础
- 数据来源:为每个联系人提取与公司沟通的约 10 封邮件作为上下文,供 AI 分析组织信息。
2. 分析对象信息
AI 将分析以下信息:
- 联系人的昵称、邮箱、姓名、职位。
- 所属公司名称、域名。
- 关系类型。
- 公司沟通人员。
- 合作信息等。
3. 关系类型细分
- 现状:合作伙伴关系类型多样。
- 计划:可能增加字段以区分不同类型,例如:
- 货代物流商
- 技术服务
- 咨询服务
- 财务
- 服务团队等
四、数据处理特殊要求
1. 增加过滤字段
- 组织表调整:增加“是否营销”列,用于过滤营销邮件信息。
2. 跟进策略设置
- 重要性标签:为组织打上重要性标签,以过滤出需要重点关注的信息。
五、数据处理流程与注意事项
1. 分工与流程
- 格式处理:说话人1处理对象格式,固定后由朱晨提取信息。
- 临时表创建:朱晨在数据库中创建临时表。
2. API 请求与优化
- 请求方式:读取每行数据,根据邮箱请求 API 获取分析结果。
- 成本预估:可能消耗 3 亿多 TOKEN。
- 优化方向:需减少重复请求以控制成本。
3. 组织合并判断
- 判重逻辑:
- 导入组织时判断组织是否已存在。
- 若存在,则补充信息;若不存在,则创建新组织。
- 特殊规则:通用邮箱不作为组织判重条件,需在脚本中过滤。
六、后续工作安排
1. 接口与脚本开发
- 接口提供:说话人1晚些时候给出接口。
- 脚本编写:朱晨根据接口先编写脚本。
2. 调试与批量处理
- 调试阶段:先导入少量数据(几个)进行调试。
- 批量运行:调试通过后,再批量运行处理全部信息。
七、其他事项
1. 测试与问题反馈
- 当前重点:测试系统,查看是否存在 Bug。
- 资料隐藏:小关已处理无数据的“11篇资料”部分。