功能一览

从文字到图像、从图像到视频、从对话到创作 —— 一站式多模态 AI 创作平台的完整能力图谱。

文生图 Text-to-Image

支持 Seedream 5.0 Lite / Pro 及更多模型
最高 2K 分辨率输出 (2048×2048)
支持中英双语 Prompt
精准控制画面风格、构图、色调
批量生成 + 异步队列处理
内置 Prompt 优化功能

图生图 Image-to-Image

上传参考图 + 文字描述混合创作
风格迁移、局部修改、二次创作
支持 WebP / JPEG / PNG 等多格式
自动图像压缩与预处理
保持原始构图,赋予新视觉表达
创意控制力度可调 (Strength)

文/图生视频 Video Generation

文字直接生成连贯视频
图片驱动视频(图生视频)
基于 Seedance 1.5 Pro / PixelDance
多种时长 & 分辨率配置
流畅运动 & 物理真实感
Celery 异步队列,后台自动生成

AI Agent 对话模式

自然语言对话驱动多步骤创作
基于豆包 2.0 多模态模型
联网搜索 & 知识库接入
MCP 工具调用协议支持
图片/视频/文档理解能力
流式输出 SSE 实时响应

技术特性

异步任务队列

Celery + Redis 驱动的分布式任务处理,支持并发批量生成与自动重试。

多租户隔离

项目级隔离,租户之间任务与数据完全独立。密码保护,无需账号注册。

双模式工作台

SaaS 可视化工作台 + 对话式 Agent,满足从精确控制到自由创意的所有场景。

BYOK 安全模型

API Key 仅存浏览器 localStorage,不入数据库,不经服务器存储。零信任架构。

智能模型路由

根据任务类型自动选择最优模型。支持 endpoint ID 直接切换,按能力精准匹配。

可扩展架构

模块化 Agent 设计,支持自定义工具、子 Agent 编排、Pipeline 桥接等高级模式。