产品功能开发安排会

会议时间：2026 年 1 月 20 日 参与人员：说话人 A（主持，负责整体功能规划与任务分派）、说话人 B（开发）、小关（前端 / 邮件相关）、朱晨（PDF / 后端相关）

一、核心议题

新增”分析图片”工具：
- 用户上传的图片会放入 workspace 文件中，不作为对话上下文消息直接发送。
- 工具对指定路径的图片文件进行分析。
- 默认使用 GPT 模型（更稳定），通过 AI Gateway provider 调用，使用环境变量里已配置的 AI Gateway key。
- 默认行为是描述图片；可增加参数控制描述的针对性，例如开发页面的代码场景下重点描述 UI 效果与布局。
- 提示语中需要根据上下文设置不同的描述侧重点，但即便有针对性也应包含基础描述。
新增”生成 / 编辑图片”工具：
- 使用 Gemini 3 image 模型，也通过 Gateway provider 调用。
- 注意：Gemini 在生成图片时走的仍是 generateText 接口，需要按生成文本的方式获取结果。
- 返回的结果如果是 URL，则直接在会话里使用；如果不是 URL，则下载下来写入 workspace。
- 是否直接写入文件或先作为上下文存在，按实际开发情况选择。
这两个工具是为后续”产品设计技能”（产品编辑与变种设计）做准备，先实现这两个基础工具，再考虑产品设计技能。

当前已有 15 个工具，加入邮件、待办、网盘、系统设置等工具后总数预计达到 30 个左右。
工具数量过多会导致一开始就消耗约 2 万 tokens，需要”压缩上下文”的方案：
- 通过一个小模型在每次发送消息时，先判断需要加载哪些工具。
- 参考 Claude Code 最近发布的 tool search tool 方案（主要针对 MCP）。
- 我们的方案可以扩展到所有工具，或对工具分类：基础工具不进搜索方案，其他工具走搜索方案。
MCP 设置先对用户隐藏，是否把所有工具作为 MCP 集成仍在评估。

发送邮件改为 agent 工具（不是独立技能），前端按 SDK 的 UI message 默认机制根据工具调用渲染。
图片分析工具默认使用 GPT 模型走 AI Gateway provider；生成 / 编辑图片使用 Gemini 3 image 走 AI Gateway provider。
Email Agent 与默认 Agent 的对话组件复用：Email agent 那部分代码重写较多，需要小关考虑能否继续复用同一个对话组件。
系统设置工具（一个工具承载两类事项）：
- 邮箱账户设置（普通用户配置邮箱较复杂，后续会有”辅助配置邮箱”的技能）。
- 自定义 AI / 个性化设置。
- 后续系统中其他设置都会被统一加载到这个 agent 里操作。

负责人	任务
小关	客户开发 / 背调输入框 + 模板（最高优先级）；发送邮件工具调用的前端渲染组件；邮件回复改为弹窗形式 + icon 化；考虑 Email agent 与默认 agent 对话组件复用；系统设置工具（邮箱账户 + 自定义 AI）
朱晨	PDF 压缩代码恢复并放入技能脚本；压缩依赖装入 doc；图片相关工具的实现（分析图片、生成 / 编辑图片）
说话人 A	Docker 命令行交互模式 bug 修复；工具搜索方案的整体设计与验证；MCP 集成方式的最终决策
说话人 B	重新实现发送邮件工具（作为 agent 工具）

后续 agent 方向：所有内置工具（邮件、待办、网盘、系统设置）默认接入到普通 agent 中，普通 agent 即可调用 Email 工具，而不需要嵌入上下文处理。
邮箱账户配置后续可能有专门的”配置辅助技能”协助用户完成。
工具数量增长后必须有上下文压缩机制（通过小模型路由 + 工具搜索）。
HTML 链接相关问题待说话人 A 进一步确认。
整体优先级以会上排序为准，不必全部做完，本周末发版。