图片编辑器开发进展与后续计划
会议总结:图片编辑器开发进展与后续计划
一、核心进展
- 前端架构
- 基于Konva的图片编辑器框架搭建完成,包含画布、工具条、弹窗三部分。
- 核心功能:拖拽、缩放(支持快捷键Control/Command+滚轮)、图层管理(后续优化显示更多信息)。
- 弹窗功能分区:编辑、创作(调用GPT接口)、背景处理(未来改用专用模型)。
- AI集成
- 当前支持Gemini(速度快,约10秒出图)和第三方OpenAI接口(慢,约90秒,但分辨率更高)。
- 计划测试低成本第三方API(价格仅为官方1/3,需验证稳定性)。
- 性能与存储优化
- 问题:当前图片以Base64存储,导致画布卡顿、Redis内存占用高。
- 解决方案:
- 图片上传至对象存储(如腾讯云S3),替换Base64。
- 监听画布图片新增事件,自动触发上传并更新链接。
- 状态管理优化:避免频繁更新Redux状态,拖拽等操作仅在结束时提交。
- 任务队列
- 使用
bullMQ
+Redis处理AI任务,但考虑未来改用数据库表(因并发低,且需持久化任务记录)。
- 使用
二、待开发功能(优先级排序)
- 基础功能
- 图片操作:下载单张/批量图片、批量插入画布(支持四宫格布局)。
- 复制粘贴:支持从画布复制图片到系统剪贴板。
- 编辑区域标记:涂抹指定区域生成Mask图层,供AI针对性修改(如局部重绘)。
- 批量处理
- 新增“批量模式”开关,支持对多张图片并发处理(如统一风格转换)。
- 数据持久化
- 画布数据保存至数据库(需前端添加“保存”按钮)。
- 任务记录存储(包括生成参数、结果URL等)。
- 业务集成
- 预设提示词:针对家具等产品提供快捷编辑指令(如改颜色、形状)。
- 自定义动作:将编辑结果通过API回传至Renewmake系统(如替换原图)。
- 其他优化
- 显示图片属性(尺寸、来源、提示词)。
- 合并重复的
utils
代码库。
三、技术决策与后续计划
- 存储迁移
- 优先实现对象存储上传,解决Base64性能问题。
- 数据库表设计需兼容画布状态和任务记录。
- 代理与API
- 代理问题统一处理(部分API需强制代理)。
- 使用React Server Action替代传统API调用,简化前后端交互。
- 分工建议
- 小关:实现下载、批量插入、画布保存按钮。
- 朱晨:协助优化状态管理,参与数据库交互设计。
- 后续重点:对象存储集成完成后,集中处理预设提示词与业务对接。
四、风险与注意事项
- 性能瓶颈:Base64传输可能触发Redis大小限制(历史版本限制5MB)。
- 第三方API稳定性:低成本OpenAI替代方案需充分测试。
- 交互优化:弹窗与右侧功能区布局需根据用户反馈调整。
下一步会议:对象存储集成完成后Review进度,并讨论预设提示词具体设计。