项目技能及系统事宜
会议时间:2026-04-01 参与人员:说话人A(项目负责人,主导)、小关(前端/技能集成);提及朱晨、商机转化 agent
一、核心议题
1. 用 Claude Code / Codex 重新创建技能
- 项目代码内技能文档历史包袱较重、干扰项太多,建议直接使用 Claude Code(配合 GLM 模型,模型设为 5.1)或 Codex(最新版的 Skill Creator)来重新创建技能。
- 新建一个独立目录,从零开始创建即可。
- 也可以直接在系统内部创建技能,但目前内置的技能创建版本较旧(即 Skill Creator 旧版),建议先把 Skill Creator 更新一下再用。
- 推荐用 Claude Code,因为 Claude 自己的官方 Skill Creator 插件功能完整;同样也可以装到 Codex 里。
2. 创建技能的关键思路
- 把当前项目作为干扰源忽略,先在干净环境下创建技能。
- 描述方式:用语音输入或者从命令行 / tmux 复制内容(小关可以帮忙清理多余空格、断行)。
- 关键描述要点:
- 流程描述(整个商机转化流程)
- 断点要求(各阶段停下来询问用户)
- 工具说明(哪些工具在 Claude Code 里没配置就简单交代一下)
- 关键点:分阶段、逐步输出、主动建议
- 把这些关键点 + 现有文档内容贴给 AI,AI 即可输出第一版技能文档。
- 第一版技能文档结构清晰,远比当前项目内的迭代版本可读。
3. 状态文件 / JSON 复杂度
- 当前项目里技能文档不清晰,原因是迭代次数多 + 状态维护用 JSON 起手稍麻烦。
- 改进方式:把状态部分抽出来,单独一个文档或单独章节处理;JSON 状态文件的字段名可保留英文,其它部分全用中文。
4. AI 在创建技能时会主动询问
- 比如商机推荐部分过于复杂、文档没给详细内容时,AI 会询问”现在只做前面的,还是后面的也做”。
- 选择”后面的也做”后,AI 会把这部分拆到独立文档(豁免阶段才会读这些详细文档),后续报价、议价都可以挂独立文档去处理。
5. 在系统中跑技能验证
- 把上面创建的技能上传到系统(个人技能里),调试时把其他技能取消勾选只保留它,避免干扰;或者勾上明确相关技能,并明确要求使用它。
- 测试时该技能能拿到系统里的工具。
- 该技能的实际表现:在客户分析阶段就完成断点(询问”是否继续挖掘进出口记录”),不会一口气把所有阶段做完。
- 调用商机转化 agent 时如果它仍然全部一次性执行,要看是不是提示语干扰:
- 检查商机转化 agent 系统提示词,让它在用户发完整流程时也能分阶段执行;
- 实在不行,先不用那个提示语;
- 但只要技能文档要求分阶段,AI 应该会遵循文档。
6. 输出文件 / function call 渲染策略
- 小关现在用一个”阶段函数”实现文件输出展示——可以用,但说话人A 倾向于在 function call 层面只做通用事情,不要把业务高度耦合进去。
- 推荐三种实现方式:
- 占位符方式(朱晨之前用过的格式):让模型在指定位置输出占位符,前端按占位符渲染卡片;
- 特殊 render:对 tool call 做特殊渲染,分析其产出文件类型(MD / PDF / HTML / 星点),按文件类型展示;
- 新建专用展示函数:类似之前的交互式 UI 函数,新增一个”在聊天中展示文件”的函数,参数传 file path;当模型生成或修改了重要文件时,调用该函数去展示。如有干扰,可把原来函数停掉。
- 在提示词里约束:写入或修改重要文本时调用该展示函数。
7. 分阶段执行的实际效果
- 改成分阶段后,每一步都更流畅,不会一次等很久。
- 之前一次性执行:客户分析、贸易记录等都是最后一次性输出,看起来排好版了,实际是憋到最后一次性吐出。
- 一次性输出 = 中间没有真正流式,只是末尾一次输出。
8. GPT5.4 模型表现
- GPT5.4 一般是”执行一会再输出一段”,但本次试的时候没有输出中间内容,需小关后续观察。
- 即使没有中间输出,分阶段断点也能保证用户不需要长时间等待。
二、技术决策与方案细节
1. 技能创建工作流(推荐做法)
- 用 Claude Code(GLM 5.1)或 Codex(最新 Skill Creator)创建技能;
- 描述流程关键点 + 贴现有文档;
- 让 AI 输出第一版技能文档,要求全部使用中文(除了术语 / JSON 状态字段可保留英文);
- 把技能上传到系统,禁用其它技能,调试运行;
- 调试时可让 AI 直接修改并覆盖技能文件;
- 评估时利用 Skill Creator 的自动评估能力(在生成技能后自动创建 3 个测试用例,分别评估”使用该技能”和”不使用该技能”两种情况);
- 把 Skill Creator 更新到系统后,理想情况下可在系统里直接做评估。
2. function call 层职责边界
- function call 层只做通用、与业务解耦的事情;
- 业务相关的展示交给:占位符渲染 / tool-call 特殊 render / 专用展示函数。
3. 新一代沙箱与 SDK 化
- 说话人A 已经做了一个更独立的运行时(沙箱),抽出了项目核心部分。
- 包含的能力:MCP 工具、agent、技能审批、整个沙箱运行机制、上下文使用情况展示等,抽象更清晰。
- agent 现在跑在新沙箱里,未来会以 SDK 形式封装,逐步取代当前实现。
4. 调试加速
- 测试运行某些公司时执行时间太长(比如要查文件),可在提示词中说”现在在测试,每次搜索减少步骤、不要搜索过多”,加快测试速度。
三、UI/交互细节
- 调用商机转化 agent 时分阶段断点:每完成阶段就询问用户是否继续,不再一气跑完。
- function call 渲染:建议新建独立展示函数(参数为 file path),在聊天中展示生成 / 修改过的文件,按 MD / PDF / HTML / 星点类型展示对应卡片。
- 出现”商机分析报告 / 贸易记录报告”重复输出现象——可能是某些步骤重复触发了渲染,需要小关后续观察处理。
四、后续行动与分工
| 角色 | 任务 |
|---|---|
| 小关 | ① 用 Claude Code / Codex + Skill Creator 重做商机转化技能,要求中文、分阶段、断点、逐步输出 ② 上传到系统调试,禁用其它技能避免干扰 ③ 实现 function call 层的展示方案(推荐新建展示函数 + 提示词约束)④ 把系统内置的 Skill Creator 更新到最新版本 ⑤ 关注 GPT5.4 中间是否输出,必要时调整提示词 ⑥ 处理零碎 bug,依据情况自行决定是否重构(充分利用 AI 自由度) |
| 朱晨 / 全员 | 后续如果商机转化 agent 提示语对技能执行产生干扰,需要重新评估是否保留该提示语 |
| 全员 | 系统里其他历史技能后续也要根据用户聊天记录全部更新一次,因为它们大多是当初一次性写出来的 |
五、其他要点
1. 系统通用化设想
- 当前系统应被视作一个”通用底座”——切换到不同公司 / 行业,只需要把所有技能与 agent 全部替换掉、重新创建即可适配。
- 因此对应的工程能力(创建技能、更新技能)需要让用户也能用到,形成”自创建 → 自更新”的闭环。
- 建议在开发中尽量尝试在系统里直接创建 / 更新技能,把 Skill Creator 更新进来后形成闭环。
2. 公司背调 vs 技能编排
- 公司背调本身也是脚本 + 指导文档,可以选择:
- 在商机转化技能里直接调用公司背调技能(类似 Codex / Claude Code 插件机制中技能间互相调用);
- 也可以把公司背调直接合并进商机转化技能,让 agent 视作同一个技能内部的步骤。
- 两种方式都可以,按情况选。
3. 提示语干扰假设
- 如果发现商机转化提示语干扰了技能执行:
- 不让该提示语进入项目上下文(可能不太行);
- 只把关键字段从填空中提取后再交给模型;
- 最终若仍干扰,则直接干掉这块旧提示语,以技能文档为主。
4. 自动评估
- Skill Creator 创建技能后会生成几个测试用例,评估”用 / 不用”该技能的差异,可作为技能质量的初步衡量。
5. 新沙箱与 SDK
- 新沙箱已能覆盖当前项目里相关运行机制;
- 未来 agent 部分会被 SDK 化,逐步替换现有实现;
- 上下文使用情况、MCP 工具、技能审、审批等都已抽象更清晰。
6. 节奏与心态
- 调技能很耗时间,但只要方法正确,第一版就能搞定”分阶段输出 + 正确断点”;
- 后续耗时主要在与公司背调等其他技能集成时的相互干扰处理;
- 重构、删除老代码可大胆放手做,AI 提供了充分的自由度。