数据导入与 AI 分析会
会议时间:09/03 11:43 - 11:58
1. 数据现状与初步处理
| 事项 | 当前状态 | 责任人 | 备注 |
|---|---|---|---|
| 最新动态数据 | Demo 数据,未录入真数据 | 朱晨 | 后续调一次 AI |
| 资料隐藏处理 | 11 篇无数据资料已隐藏 | 小关 | — |
| 联系人搜索存储 | 直接存入,不用员工 ID | — | 弃用旧逻辑 |
| 添加问题处理 | 存在小问题 | — | 待反馈后处理 |
2. 导入组织数据情况
- 联系人总量:邮件备份库读出 ≈ 2 万
- 过滤后量:去掉推广邮件 ≈ 1 万(有直接公司联系)
- 导入流程
- 提取联系人信息 + 组织信息
- 最终导入 ≈ 1 万联系人
3. AI 分析相关内容
| 维度 | 内容 |
|---|---|
| 分析数据基础 | 每个联系人取约 10 封与公司往来邮件作为上下文 |
| 分析对象信息 | 昵称、邮箱、姓名、职位、公司名、域名、关系类型、公司沟通人、合作信息等 |
| 关系类型细分 | 拟新增字段区分:货代物流商、技术服务、咨询服务、财务、服务团队 … |
4. 数据处理特殊要求
- 新增字段
- 组织表加
是否营销列,用于过滤营销邮件
- 组织表加
- 跟进策略
- 为组织打重要性标签,聚焦重点信息
5. 数据处理流程与注意事项
| 步骤 | 说明 | 责任人 | 风险/注意 |
|---|---|---|---|
| 格式处理与提取 | 对象格式固定 → 信息提取 | 说话人 1 → 朱晨 | 格式需先固化 |
| 临时表创建与请求 | 建临时表,按邮箱调 API 拿分析结果 | 朱晨 | 预估 3 亿 TOKEN,需防重复请求 |
| 组织合并判断 | 存在则补充,不存在则新建;通用邮箱不参与判重 | 朱晨 | 脚本须过滤通用邮箱 |
6. 后续工作安排
| 任务 | 输出 | 责任人 | 时间节点 |
|---|---|---|---|
| 提供接口 | 接口文档 | 说话人 1 | 今天晚些时候 |
| 编写脚本 | 组织信息处理脚本(含通用邮箱过滤) | 朱晨 | 接口提供后 |
| 调试 & 批量 | 先导入少量数据调试 → 全量 | 朱晨 | 调试通过后 |
7. 本次会后具体任务清单
- 结果格式处理
- 固化 AI 分析结果格式
- 在表中新增列
AI 分析结果 - 创建临时表供后续处理
- 脚本编写任务
- 依据接口编写组织信息处理脚本
- 过滤通用邮箱(不作为判重条件)
- 先导入少量数据调试,确认无误后批量运行