项目技能及系统事宜

会议时间:2026-04-01 参与人员:说话人A(项目负责人,主导)、小关(前端/技能集成);提及朱晨、商机转化 agent

一、核心议题

1. 用 Claude Code / Codex 重新创建技能

  • 项目代码内技能文档历史包袱较重、干扰项太多,建议直接使用 Claude Code(配合 GLM 模型,模型设为 5.1)或 Codex(最新版的 Skill Creator)来重新创建技能。
  • 新建一个独立目录,从零开始创建即可。
  • 也可以直接在系统内部创建技能,但目前内置的技能创建版本较旧(即 Skill Creator 旧版),建议先把 Skill Creator 更新一下再用。
  • 推荐用 Claude Code,因为 Claude 自己的官方 Skill Creator 插件功能完整;同样也可以装到 Codex 里。

2. 创建技能的关键思路

  • 把当前项目作为干扰源忽略,先在干净环境下创建技能。
  • 描述方式:用语音输入或者从命令行 / tmux 复制内容(小关可以帮忙清理多余空格、断行)。
  • 关键描述要点:
    • 流程描述(整个商机转化流程)
    • 断点要求(各阶段停下来询问用户)
    • 工具说明(哪些工具在 Claude Code 里没配置就简单交代一下)
    • 关键点:分阶段、逐步输出、主动建议
  • 把这些关键点 + 现有文档内容贴给 AI,AI 即可输出第一版技能文档。
  • 第一版技能文档结构清晰,远比当前项目内的迭代版本可读。

3. 状态文件 / JSON 复杂度

  • 当前项目里技能文档不清晰,原因是迭代次数多 + 状态维护用 JSON 起手稍麻烦。
  • 改进方式:把状态部分抽出来,单独一个文档或单独章节处理;JSON 状态文件的字段名可保留英文,其它部分全用中文。

4. AI 在创建技能时会主动询问

  • 比如商机推荐部分过于复杂、文档没给详细内容时,AI 会询问”现在只做前面的,还是后面的也做”。
  • 选择”后面的也做”后,AI 会把这部分拆到独立文档(豁免阶段才会读这些详细文档),后续报价、议价都可以挂独立文档去处理。

5. 在系统中跑技能验证

  • 把上面创建的技能上传到系统(个人技能里),调试时把其他技能取消勾选只保留它,避免干扰;或者勾上明确相关技能,并明确要求使用它。
  • 测试时该技能能拿到系统里的工具。
  • 该技能的实际表现:在客户分析阶段就完成断点(询问”是否继续挖掘进出口记录”),不会一口气把所有阶段做完。
  • 调用商机转化 agent 时如果它仍然全部一次性执行,要看是不是提示语干扰:
    • 检查商机转化 agent 系统提示词,让它在用户发完整流程时也能分阶段执行;
    • 实在不行,先不用那个提示语;
    • 但只要技能文档要求分阶段,AI 应该会遵循文档。

6. 输出文件 / function call 渲染策略

  • 小关现在用一个”阶段函数”实现文件输出展示——可以用,但说话人A 倾向于在 function call 层面只做通用事情,不要把业务高度耦合进去。
  • 推荐三种实现方式:
    1. 占位符方式(朱晨之前用过的格式):让模型在指定位置输出占位符,前端按占位符渲染卡片;
    2. 特殊 render:对 tool call 做特殊渲染,分析其产出文件类型(MD / PDF / HTML / 星点),按文件类型展示;
    3. 新建专用展示函数:类似之前的交互式 UI 函数,新增一个”在聊天中展示文件”的函数,参数传 file path;当模型生成或修改了重要文件时,调用该函数去展示。如有干扰,可把原来函数停掉。
  • 在提示词里约束:写入或修改重要文本时调用该展示函数。

7. 分阶段执行的实际效果

  • 改成分阶段后,每一步都更流畅,不会一次等很久。
  • 之前一次性执行:客户分析、贸易记录等都是最后一次性输出,看起来排好版了,实际是憋到最后一次性吐出。
  • 一次性输出 = 中间没有真正流式,只是末尾一次输出。

8. GPT5.4 模型表现

  • GPT5.4 一般是”执行一会再输出一段”,但本次试的时候没有输出中间内容,需小关后续观察。
  • 即使没有中间输出,分阶段断点也能保证用户不需要长时间等待。

二、技术决策与方案细节

1. 技能创建工作流(推荐做法)

  1. 用 Claude Code(GLM 5.1)或 Codex(最新 Skill Creator)创建技能;
  2. 描述流程关键点 + 贴现有文档;
  3. 让 AI 输出第一版技能文档,要求全部使用中文(除了术语 / JSON 状态字段可保留英文);
  4. 把技能上传到系统,禁用其它技能,调试运行;
  5. 调试时可让 AI 直接修改并覆盖技能文件;
  6. 评估时利用 Skill Creator 的自动评估能力(在生成技能后自动创建 3 个测试用例,分别评估”使用该技能”和”不使用该技能”两种情况);
  7. 把 Skill Creator 更新到系统后,理想情况下可在系统里直接做评估。

2. function call 层职责边界

  • function call 层只做通用、与业务解耦的事情;
  • 业务相关的展示交给:占位符渲染 / tool-call 特殊 render / 专用展示函数。

3. 新一代沙箱与 SDK 化

  • 说话人A 已经做了一个更独立的运行时(沙箱),抽出了项目核心部分。
  • 包含的能力:MCP 工具、agent、技能审批、整个沙箱运行机制、上下文使用情况展示等,抽象更清晰。
  • agent 现在跑在新沙箱里,未来会以 SDK 形式封装,逐步取代当前实现。

4. 调试加速

  • 测试运行某些公司时执行时间太长(比如要查文件),可在提示词中说”现在在测试,每次搜索减少步骤、不要搜索过多”,加快测试速度。

三、UI/交互细节

  • 调用商机转化 agent 时分阶段断点:每完成阶段就询问用户是否继续,不再一气跑完。
  • function call 渲染:建议新建独立展示函数(参数为 file path),在聊天中展示生成 / 修改过的文件,按 MD / PDF / HTML / 星点类型展示对应卡片。
  • 出现”商机分析报告 / 贸易记录报告”重复输出现象——可能是某些步骤重复触发了渲染,需要小关后续观察处理。

四、后续行动与分工

角色任务
小关① 用 Claude Code / Codex + Skill Creator 重做商机转化技能,要求中文、分阶段、断点、逐步输出 ② 上传到系统调试,禁用其它技能避免干扰 ③ 实现 function call 层的展示方案(推荐新建展示函数 + 提示词约束)④ 把系统内置的 Skill Creator 更新到最新版本 ⑤ 关注 GPT5.4 中间是否输出,必要时调整提示词 ⑥ 处理零碎 bug,依据情况自行决定是否重构(充分利用 AI 自由度)
朱晨 / 全员后续如果商机转化 agent 提示语对技能执行产生干扰,需要重新评估是否保留该提示语
全员系统里其他历史技能后续也要根据用户聊天记录全部更新一次,因为它们大多是当初一次性写出来的

五、其他要点

1. 系统通用化设想

  • 当前系统应被视作一个”通用底座”——切换到不同公司 / 行业,只需要把所有技能与 agent 全部替换掉、重新创建即可适配。
  • 因此对应的工程能力(创建技能、更新技能)需要让用户也能用到,形成”自创建 → 自更新”的闭环。
  • 建议在开发中尽量尝试在系统里直接创建 / 更新技能,把 Skill Creator 更新进来后形成闭环。

2. 公司背调 vs 技能编排

  • 公司背调本身也是脚本 + 指导文档,可以选择:
    • 在商机转化技能里直接调用公司背调技能(类似 Codex / Claude Code 插件机制中技能间互相调用);
    • 也可以把公司背调直接合并进商机转化技能,让 agent 视作同一个技能内部的步骤。
  • 两种方式都可以,按情况选。

3. 提示语干扰假设

  • 如果发现商机转化提示语干扰了技能执行:
    • 不让该提示语进入项目上下文(可能不太行);
    • 只把关键字段从填空中提取后再交给模型;
    • 最终若仍干扰,则直接干掉这块旧提示语,以技能文档为主。

4. 自动评估

  • Skill Creator 创建技能后会生成几个测试用例,评估”用 / 不用”该技能的差异,可作为技能质量的初步衡量。

5. 新沙箱与 SDK

  • 新沙箱已能覆盖当前项目里相关运行机制;
  • 未来 agent 部分会被 SDK 化,逐步替换现有实现;
  • 上下文使用情况、MCP 工具、技能审、审批等都已抽象更清晰。

6. 节奏与心态

  • 调技能很耗时间,但只要方法正确,第一版就能搞定”分阶段输出 + 正确断点”;
  • 后续耗时主要在与公司背调等其他技能集成时的相互干扰处理;
  • 重构、删除老代码可大胆放手做,AI 提供了充分的自由度。