Files
localMiniDrama/docs/configuration.md
T
2026-06-30 15:07:31 +08:00

8.7 KiB
Raw Blame History

AI 配置指南

导航:项目主页 | 快速开始 | English


目录


配置入口

点击软件右上角 「AI 配置」 按钮,进入 AI 服务管理页面。

页面分为三个 Tab

  • 文本生成 — 用于生成剧本、分镜脚本、提示词等
  • 图片生成 — 用于生成角色图、场景图、分镜图
  • 视频生成 — 用于生成分镜视频片段

每类模型可独立配置不同的服务商和模型,互不影响。


三类模型配置

类型 用途 推荐服务商
文本生成 剧本生成、角色提取、分镜脚本、提示词优化 通义 Qwen、豆包 Pro
图片生成 角色形象图、场景背景图、分镜静帧图 通义万象、豆包图片
视频生成 分镜视频片段 豆包 Seedance(经典单链路或 Seedance 2.0 多图 / 全能模式

阿里云 DashScope(通义)

申请 API Key

  1. 访问 阿里云百炼控制台
  2. 注册/登录阿里云账号
  3. 进入「模型广场」,开通你需要的模型(文本类、图片类等)
  4. 左侧菜单点击「API-KEY 管理」,创建新的 API Key
  5. 复制 API Key(以 sk- 开头)

新用户通常有免费额度,建议先用免费额度测试。

可用模型

文本生成:

模型名 说明
qwen-turbo 速度快、成本低,适合批量生成
qwen-plus 性能均衡,推荐日常使用
qwen-max 最强文本能力,适合剧本生成
qwen-long 超长上下文,适合长剧本

图片生成:

模型名 说明
wanx2.1-t2i-turbo 速度快,通用图片生成
wanx2.1-t2i-plus 更高质量
wanx-v1 经典版本

视频生成:

模型名 说明
wan2.1-t2v-turbo 文字转视频,速度较快
wan2.1-t2v-plus 更高质量

配置示例

在「AI 配置」页面新增配置:

服务商:DashScope
Base URLhttps://dashscope.aliyuncs.com/compatible-mode/v1
API Keysk-xxxxxxxxxxxxxxxx
模型:qwen-plus(文本)/ wanx2.1-t2i-turbo(图片)/ wan2.1-t2v-turbo(视频)

火山引擎 Volcengine(豆包)

申请 API Key

  1. 访问 火山方舟控制台
  2. 注册/登录火山引擎账号
  3. 进入「模型广场」,开通所需模型(文本/图片/视频)
  4. 左侧点击「API Key 管理」,创建 API Key
  5. 复制 API Key

💡 视频生成(Seedance)需要单独开通,且按生成时长计费,注意控制用量。

可用模型

文本生成:

模型名 API 端点 ID 说明
Doubao-pro-32k doubao-pro-32k-241215 通用高性能模型
Doubao-lite-32k doubao-lite-32k-241215 低成本模型
Doubao-pro-128k doubao-pro-128k-241215 超长上下文

图片生成:

模型名 API 端点 ID 说明
Doubao-seedream-4.5 doubao-seedream-4-5-251128 高质量图片生成

视频生成:

模型名 API 端点 ID 说明
Doubao-Seedance-1.0-pro-fast doubao-seedance-1-0-pro-250528 较快速度
Doubao-Seedance-1.5-pro doubao-seedance-1-5-pro-251215 高质量版
Doubao-Seedance-2.0-pro doubao-seedance-2-0-260128 Seedance 2.0,方舟多参考图;配合接口规范 volcengine_omni 与分镜全能模式
Doubao-Seedance-2.0-fast doubao-seedance-2-0-fast-260128 Seedance 2.0 快速版

⚠️ 配置中填写模型名时,系统会自动映射到正确的 API 端点 ID,两种写法均可。

分镜「全能模式」与接口规范(v1.2.5+,v1.2.7 增强校验):

  • 制作页单个分镜可切换为 「全能模式」:中间编辑区为片段描述,可用 @图片1@图片2 对应参考图顺序(一般为场景 → 角色 → 物品;不含经典分镜中间主图;@图片N 后建议加半角空格)。若该框有内容,生视频时只发送这段文本,不会拼接下方结构化「视频提示词」。
  • AI 配置 → 视频生成 中,将 接口规范 选为 volcengine_omni(火山即梦 Seedance 2.0 等多图参考)或 kling_omni(可灵 Omni)。Seedance 2.x 单段时长由后端吸附到 415 秒;方舟多图侧最多 9 张参考图。
  • v1.2.7:单条生视频前会检测配置是否匹配(kling_omni,或 volcengine_omni + Seedance 2.x 模型名);不匹配时弹窗说明,可选强制继续(降级为场景图 / 分镜主图参考)。经典模式无分镜参考图时会提示先生成分镜图,不提供纯文案强行生成。
  • 亦可使用 可灵 Omni 走同一套全能分镜工作流,详见 AI 配置页内嵌说明。

配置示例

服务商:Volcengine
Base URLhttps://ark.cn-beijing.volces.com/api/v3
API Keyxxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx
模型:Doubao-pro-32k(文本)/ Doubao-seedream-4.5(图片)/ Doubao-Seedance-1.0-pro-fast(视频)

视频生成参数(可选):

参数 说明 默认值
分辨率 720p / 1080p / 480p 720p
视频时长 每段分镜的视频秒数(4 / 5 / 8 / 10s 5
seed 随机种子,固定可复现结果 随机
camera_fixed 是否固定摄像机 false
watermark 是否添加水印 false

本地部署模型(Ollama 等)

如果你在本机或内网部署了兼容 OpenAI 接口的模型服务(如 Ollama、LM Studio、vLLM 等):

服务商:自定义 / OpenAI 兼容
Base URLhttp://localhost:11434/v1   Ollama 示例)
API Keyollama   (或任意字符串,本地服务通常不验证)
模型:qwen2.5:7b   (你下载的模型名)

⚠️ 本地模型仅适用于文本生成,图片和视频生成通常需要专用的云端 API。


其他 OpenAI 兼容接口

任何支持 OpenAI Chat Completions 协议的接口均可接入:

Base URLhttps://your-api-endpoint/v1
API Keyyour-api-key
模型:your-model-name

常见兼容服务商:DeepSeek、硅基流动(SiliconFlow)、Groq、OpenRouter 等。


一键配置功能

在「AI 配置」页面,点击顶部的:

  • 「一键配置通义」 — 自动创建阿里云 DashScope 的文本/图片/视频三套配置模板
  • 「一键配置火山」 — 自动创建火山引擎的文本/图片/视频三套配置模板

一键配置后,只需填入你的 API Key,其他参数已预填好,点击「保存」即可使用。


连接测试

每条 AI 配置记录右侧有「测试」按钮,点击后会发送一条简短请求验证连接是否正常。
测试成功显示绿色提示,失败会显示具体错误信息(如认证失败、模型不存在等)。


常见问题

Q: API Key 填错了或过期了怎么办?

在「AI 配置」页面找到对应记录,点击编辑,修改 API Key 后保存即可立即生效。


Q: 生成图片时提示「image size must be at least 3686400 pixels」

这是火山引擎图片生成 API 的最低像素要求。本系统会自动根据项目设定的画面比例计算合适的分辨率(最低 2560×1440),通常无需手动处理。如果仍然报错,请检查是否配置了自定义的 size 参数。


Q: 视频生成提示「model does not exist」

火山引擎视频模型的 API 端点 ID 与展示名称不同。请确认你已在火山方舟控制台开通了该模型,并使用正确的模型名称。系统内置了常见模型名称的映射,两种写法(展示名 / 端点 ID)均支持。


Q: 生成速度很慢怎么办?

  • 图片生成通常需要 1560 秒
  • 视频生成通常需要 1–5 分钟(取决于时长和分辨率)
  • 建议使用 turbofast 后缀的模型加快速度
  • 如频繁遇到 429 限流,系统会自动重试,无需手动干预

← 返回项目主页