项目技能及系统事宜

Apr 1, 2026 会议总结葵普

会议时间：2026-04-01 参与人员：说话人A（项目负责人，主导）、小关（前端/技能集成）；提及朱晨、商机转化 agent

一、核心议题

1. 用 Claude Code / Codex 重新创建技能

项目代码内技能文档历史包袱较重、干扰项太多，建议直接使用 Claude Code（配合 GLM 模型，模型设为 5.1）或 Codex（最新版的 Skill Creator）来重新创建技能。
新建一个独立目录，从零开始创建即可。
也可以直接在系统内部创建技能，但目前内置的技能创建版本较旧（即 Skill Creator 旧版），建议先把 Skill Creator 更新一下再用。
推荐用 Claude Code，因为 Claude 自己的官方 Skill Creator 插件功能完整；同样也可以装到 Codex 里。

2. 创建技能的关键思路

把当前项目作为干扰源忽略，先在干净环境下创建技能。
描述方式：用语音输入或者从命令行 / tmux 复制内容（小关可以帮忙清理多余空格、断行）。
关键描述要点：
- 流程描述（整个商机转化流程）
- 断点要求（各阶段停下来询问用户）
- 工具说明（哪些工具在 Claude Code 里没配置就简单交代一下）
- 关键点：分阶段、逐步输出、主动建议
把这些关键点 + 现有文档内容贴给 AI，AI 即可输出第一版技能文档。
第一版技能文档结构清晰，远比当前项目内的迭代版本可读。

3. 状态文件 / JSON 复杂度

当前项目里技能文档不清晰，原因是迭代次数多 + 状态维护用 JSON 起手稍麻烦。
改进方式：把状态部分抽出来，单独一个文档或单独章节处理；JSON 状态文件的字段名可保留英文，其它部分全用中文。

4. AI 在创建技能时会主动询问

比如商机推荐部分过于复杂、文档没给详细内容时，AI 会询问”现在只做前面的，还是后面的也做”。
选择”后面的也做”后，AI 会把这部分拆到独立文档（豁免阶段才会读这些详细文档），后续报价、议价都可以挂独立文档去处理。

5. 在系统中跑技能验证

把上面创建的技能上传到系统（个人技能里），调试时把其他技能取消勾选只保留它，避免干扰；或者勾上明确相关技能，并明确要求使用它。
测试时该技能能拿到系统里的工具。
该技能的实际表现：在客户分析阶段就完成断点（询问”是否继续挖掘进出口记录”），不会一口气把所有阶段做完。
调用商机转化 agent 时如果它仍然全部一次性执行，要看是不是提示语干扰：
- 检查商机转化 agent 系统提示词，让它在用户发完整流程时也能分阶段执行；
- 实在不行，先不用那个提示语；
- 但只要技能文档要求分阶段，AI 应该会遵循文档。

6. 输出文件 / function call 渲染策略

小关现在用一个”阶段函数”实现文件输出展示——可以用，但说话人A 倾向于在 function call 层面只做通用事情，不要把业务高度耦合进去。
推荐三种实现方式：
1. 占位符方式（朱晨之前用过的格式）：让模型在指定位置输出占位符，前端按占位符渲染卡片；
2. 特殊 render：对 tool call 做特殊渲染，分析其产出文件类型（MD / PDF / HTML / 星点），按文件类型展示；
3. 新建专用展示函数：类似之前的交互式 UI 函数，新增一个”在聊天中展示文件”的函数，参数传 file path；当模型生成或修改了重要文件时，调用该函数去展示。如有干扰，可把原来函数停掉。
在提示词里约束：写入或修改重要文本时调用该展示函数。

7. 分阶段执行的实际效果

改成分阶段后，每一步都更流畅，不会一次等很久。
之前一次性执行：客户分析、贸易记录等都是最后一次性输出，看起来排好版了，实际是憋到最后一次性吐出。
一次性输出 = 中间没有真正流式，只是末尾一次输出。

8. GPT5.4 模型表现

GPT5.4 一般是”执行一会再输出一段”，但本次试的时候没有输出中间内容，需小关后续观察。
即使没有中间输出，分阶段断点也能保证用户不需要长时间等待。

二、技术决策与方案细节

1. 技能创建工作流（推荐做法）

用 Claude Code（GLM 5.1）或 Codex（最新 Skill Creator）创建技能；
描述流程关键点 + 贴现有文档；
让 AI 输出第一版技能文档，要求全部使用中文（除了术语 / JSON 状态字段可保留英文）；
把技能上传到系统，禁用其它技能，调试运行；
调试时可让 AI 直接修改并覆盖技能文件；
评估时利用 Skill Creator 的自动评估能力（在生成技能后自动创建 3 个测试用例，分别评估”使用该技能”和”不使用该技能”两种情况）；
把 Skill Creator 更新到系统后，理想情况下可在系统里直接做评估。

2. function call 层职责边界

function call 层只做通用、与业务解耦的事情；
业务相关的展示交给：占位符渲染 / tool-call 特殊 render / 专用展示函数。

3. 新一代沙箱与 SDK 化

说话人A 已经做了一个更独立的运行时（沙箱），抽出了项目核心部分。
包含的能力：MCP 工具、agent、技能审批、整个沙箱运行机制、上下文使用情况展示等，抽象更清晰。
agent 现在跑在新沙箱里，未来会以 SDK 形式封装，逐步取代当前实现。

4. 调试加速

测试运行某些公司时执行时间太长（比如要查文件），可在提示词中说”现在在测试，每次搜索减少步骤、不要搜索过多”，加快测试速度。

三、UI/交互细节

调用商机转化 agent 时分阶段断点：每完成阶段就询问用户是否继续，不再一气跑完。
function call 渲染：建议新建独立展示函数（参数为 file path），在聊天中展示生成 / 修改过的文件，按 MD / PDF / HTML / 星点类型展示对应卡片。
出现”商机分析报告 / 贸易记录报告”重复输出现象——可能是某些步骤重复触发了渲染，需要小关后续观察处理。

四、后续行动与分工

角色	任务
小关	① 用 Claude Code / Codex + Skill Creator 重做商机转化技能，要求中文、分阶段、断点、逐步输出 ② 上传到系统调试，禁用其它技能避免干扰 ③ 实现 function call 层的展示方案（推荐新建展示函数 + 提示词约束）④ 把系统内置的 Skill Creator 更新到最新版本 ⑤ 关注 GPT5.4 中间是否输出，必要时调整提示词 ⑥ 处理零碎 bug，依据情况自行决定是否重构（充分利用 AI 自由度）
朱晨 / 全员	后续如果商机转化 agent 提示语对技能执行产生干扰，需要重新评估是否保留该提示语
全员	系统里其他历史技能后续也要根据用户聊天记录全部更新一次，因为它们大多是当初一次性写出来的

五、其他要点

1. 系统通用化设想

当前系统应被视作一个”通用底座”——切换到不同公司 / 行业，只需要把所有技能与 agent 全部替换掉、重新创建即可适配。
因此对应的工程能力（创建技能、更新技能）需要让用户也能用到，形成”自创建 → 自更新”的闭环。
建议在开发中尽量尝试在系统里直接创建 / 更新技能，把 Skill Creator 更新进来后形成闭环。

2. 公司背调 vs 技能编排

公司背调本身也是脚本 + 指导文档，可以选择：
- 在商机转化技能里直接调用公司背调技能（类似 Codex / Claude Code 插件机制中技能间互相调用）；
- 也可以把公司背调直接合并进商机转化技能，让 agent 视作同一个技能内部的步骤。
两种方式都可以，按情况选。

3. 提示语干扰假设

如果发现商机转化提示语干扰了技能执行：
- 不让该提示语进入项目上下文（可能不太行）；
- 只把关键字段从填空中提取后再交给模型；
- 最终若仍干扰，则直接干掉这块旧提示语，以技能文档为主。

4. 自动评估

Skill Creator 创建技能后会生成几个测试用例，评估”用 / 不用”该技能的差异，可作为技能质量的初步衡量。

5. 新沙箱与 SDK

新沙箱已能覆盖当前项目里相关运行机制；
未来 agent 部分会被 SDK 化，逐步替换现有实现；
上下文使用情况、MCP 工具、技能审、审批等都已抽象更清晰。

6. 节奏与心态

调技能很耗时间，但只要方法正确，第一版就能搞定”分阶段输出 + 正确断点”；
后续耗时主要在与公司背调等其他技能集成时的相互干扰处理；
重构、删除老代码可大胆放手做，AI 提供了充分的自由度。