文档中心

从入门到精通,帮助你快速上手多模态创作平台。

快速入门

1. 创建项目

访问首页,点击「开始创作」进入项目列表页面。点击「创建新项目」,输入项目名称和访问密码。密码用于保护你的项目空间,请妥善保管。

2. 获取 API Key

前往火山引擎 ARK 控制台 (console.volcengine.com/ark) 创建推理接入点(Endpoint),复制生成的 API Key。你可能需要分别为多模态对话、文生图、文生视频创建不同的 Endpoint。

3. 配置并开始

进入项目后,在全局设置或 Agent 侧边栏中粘贴你的 API Key。密钥仅存储在你的浏览器中,不会上传到服务器。配置完成后即可开始创作。

SaaS 工作台

SaaS 工作台提供可视化的创作界面。在左侧选择创作模式(文生图/图生图/文生视频/图生视频),在中央区域配置参数、编写 Prompt、上传参考图。右侧为生成结果预览区。

支持多帧编排(Storyboard 模式):可以一次性设置多个关键帧,平台会自动按顺序生成,形成完整的视觉叙事。

所有任务通过 Celery 异步队列处理。提交后可以在任务列表中查看进度,生成完成后自动通知。

Agent 对话模式

Agent 模式提供对话式交互体验。你可以用自然语言描述创意需求,AI 自动拆解任务、调用合适的工具完成创作。

在左侧栏可以配置:模型选择、工具开关(联网搜索、豆包助手、图片处理、知识库、MCP 调用)、以及 API 密钥。

支持图片、视频、音频文件上传,Agent 可以理解并分析多模态内容,然后基于理解结果进行进一步创作。

API Key 指南

本平台采用 BYOK(自带密钥)模式。你需要在火山引擎开通 ARK 服务并创建推理接入点。

各能力对应的模型:

多模态对话:doubao-2.0-lite-32k(推荐)

文生图:doubao-seedream-5-0-lite / pro

文/图生视频:doubao-seedance-1-5-pro

⚠️ 安全提示:你的 API Key 仅存储在浏览器 localStorage 中,通过 HTTPS 请求头传输到后端。后端即时使用后不做任何持久化存储。清除浏览器数据会删除密钥。

常见问题

需要注册账号吗?

不需要。你只需创建一个项目并设置密码即可使用。没有邮箱注册、没有第三方登录。

我的 API Key 安全吗?

是的。API Key 存储在你浏览器的 localStorage 中,通过加密的 HTTPS 请求头传输。服务器不做任何存储。

其他人能看到我的创作内容吗?

不能。每个项目是完全隔离的多租户空间,你的任务和资源只有知道项目密码的人才能访问。

支持哪些图片格式?

支持 PNG、JPEG、WebP、BMP、TIFF、GIF、HEIC、HEIF。上传后会自动压缩转换为最优格式。

生成失败怎么办?

系统会自动重试最多 3 次。如果仍然失败,请检查 API Key 是否有效、Endpoint 是否正确、以及模型是否有权限。常见错误:403 表示 Key 无权限。