创建视频生成任务
本接口用于创建视频生成任务。融云 AI 服务接入了 Seedance 2.0 系列能力并对外提供视频生成服务,模型会依据传入的文本、图片、视频和音频等信息生成视频。视频生成是异步过程,创建成功后会返回任务 ID,您可通过查询视频生成任务接口轮询任务状态,并在任务成功后获取生成结果。
视频生成任务的执行过程是异步的,最终结果需要通过查询任务接口获取。创建任务的 HTTP 请求在受理阶段也可能需要一定处理时间,因此不一定会立即返回任务 ID。受 Seedance 2.0 系列模型上游处理机制影响,请求受理阶段可能会先执行若干降噪与推理相关步骤,因此接口响应时间可能明显长于普通异步任务创建请求。
对于较复杂的生成任务,创建请求在少数情况下可能需要数分钟才返回任务 ID。建议客户端适当放宽 HTTP 读超时时间,并避免因等待时间较长而误判为接口异常。
支持能力
Doubao/Doubao-seedance-2.0、Doubao/Doubao-seedance-2.0-fast:支持文生视频、首帧图生视频、首尾帧图生视频、多模态参考生视频,可生成有声或无声视频。Doubao/Doubao-seedance-1.5-pro:支持文生视频、首帧图生视频、首尾帧图生视频、Draft 样片模式,可生成有声或无声视频。
请求方法
POST:<ai-api-base-url>/llm/v1/contents/generations/tasks
其中,<ai-api-base-url> 为您的 API Key 所属数据中心的域名:
- 北京数据中心:
https://ai.rong-api.com - 北美数据中心:
https://ai.us-light-api.com
请求头参数
| 参数名 | 类型 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|---|
| Authorization | string | 是 | - | 身份认证令牌,格式为 Bearer <your API key>,需替换为实际 API Key,用于验证用户权限。 |
正文参数
| 参数名 | 类型 | 是否必填 | 默认值 | 说明 |
|---|---|---|---|---|
| model | string | 是 | - | 调用的模型名称。当前支持 Doubao/Doubao-seedance-2.0、Doubao/Doubao-seedance-2.0-fast、Doubao/Doubao-seedance-1.5-pro。 |
| content | object[] | 是 | - | 输入给模型的内容,支持文本、图片、视频、音频和样片任务 ID 的组合。当前支持以下场景:文本;首帧图片(可选文本);首尾帧图片(可选文本);参考图片(可选文本);参考视频(可选文本);参考图片 + 参考音频(可选文本);参考视频 + 参考音频(可选文本);参考图片 + 参考视频(可选文本);参考图片 + 参考视频 + 参考音频(可选文本);样片任务 ID(仅 Doubao/Doubao-seedance-1.5-pro 支持)。详见下方 content 参数说明。 |
| callback_url | string | 否 | - | 任务状态变更时的回调通知地址。融云将向此地址发送 POST 请求,回调内容结构与查询视频生成任务接口的返回体一致。回调状态包括:queued、running、succeeded、failed、expired。 |
| return_last_frame | boolean | 否 | false | 是否返回生成视频的尾帧图像。true:返回 PNG 格式尾帧图像,可用于作为下一个视频任务的首帧,实现多段连续视频生成;false:不返回尾帧图像。尾帧图像可通过查询视频生成任务接口获取。 |
| service_tier | string | 否 | default | 处理本次请求的服务等级。default:在线推理模式;flex:离线推理模式。Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 暂不支持 flex。任务提交后不支持 修改服务等级。 |
| execution_expires_after | integer | 否 | 172800 | 任务超时阈值,单位:秒,从任务创建时间开始计算。默认值为 172800 秒(48 小时),取值范围为 [3600, 259200]。超过该时间后,任务会被自动终止并标记为 expired。 |
| generate_audio | boolean | 否 | true | 是否生成与画面同步的音频。仅 Doubao/Doubao-seedance-2.0、Doubao/Doubao-seedance-2.0-fast、Doubao/Doubao-seedance-1.5-pro 支持。true:输出包含人声、音效及背景音乐;false:输出无声视频。建议将对话内容放在双引号内,以提升音频生成效果。生成的有声视频为单声道。 |
| draft | boolean | 否 | false | 是否开启样片模式。仅 Doubao/Doubao-seedance-1.5-pro 支持。true:生成 Draft 预览视频,用于快速验证场景结构、镜头调度和 prompt 意图;false:正常生成视频。开启样片模式后,固定使用 480p 分辨率,不支持返回尾帧,不支持离线推理。 |
| tools | object[] | 否 | - | 配置模型可调用的工具。仅 Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 支持。当前支持 web_search 联网搜索工具。 |
| safety_identifier | string | 否 | - | 终端用户的唯一标识符,用于协助融云进行安全治理。建议传入对用户名、用户 ID 或邮箱进行哈希处理后的英文字符串,长度不超过 64 个字符。 |
| resolution | string | 否 | 720p | 输出视频分辨率。可选值:480p、720p、1080p。Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 不支持 1080p。 |
| ratio | string | 否 | adaptive | 输出视频宽高比。可选值:16:9、4:3、1:1、3:4、9:16、21:9、adaptive。对于 Doubao/Doubao-seedance-2.0、Doubao/Doubao-seedance-2.0-fast 和 Doubao/Doubao-seedance-1.5-pro,默认值为 adaptive。设置为 adaptive 时,模型会根据提示词或首帧素材自动选择最合适的宽高比,实际结果可通过查询接口的 ratio 字段获取。 |
| duration | integer | 否 | 5 | 视频时长,单位:秒。Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 支持 [4, 15] 范围内的整数,Doubao/Doubao-seedance-1.5-pro 支持 [4, 12] 范围内的整数;上述模型均支持设置为 -1,由模型自动选择合适时长。 |
| frames | integer | 否 | - | 生成视频的帧数,与 duration 二选一,且 frames 优先级更高。该字段用于按帧控制视频长度,但当前融云对外可用的 Doubao/Doubao-seedance-2.0、Doubao/Doubao-seedance-2.0-fast、Doubao/Doubao-seedance-1.5-pro 暂不支持此参数。 |
| seed | integer | 否 | -1 | 随机种子,用于控制生成结果的随机性。取值范围为 [-1, 2^32-1]。设置为 -1 时使用随机数;相同请求和相同 seed 会生成相似结果,但不保证完全一致。 |
| camera_fixed | boolean | 否 | false | 是否固定摄像头视角。true:固定摄像头;false:允许镜头运动。Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 暂不支持此参数。 |
| watermark | boolean | 否 | false | 是否在输出视频中添加水印。true:添加水印;false:不添加水印。 |
content 参数说明
content 数组的每个元素通过 type 字段区分输入类型。支持的输入类型如下。除纯文本和样片任务场景外,参考素材场景中的 text 输入可选传。
文本输入(type: "text"):
| 字段 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
type | string | 是 | 固定值 "text"。 |
text | string | 是 | 文本提示词,描述期望生成的视频内容、风格、镜头运动等。支持中英文,建议中文不超过 500 字、英文不超过 1000 词。Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 还支持日语、印尼语、西班牙语、葡萄牙语。 |
图片输入(type: "image_url"):
| 字段 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
type | string | 是 | 固定值 "image_url"。 |
image_url.url | string | 是 | 图片的公网可访问 URL 或 Base64 编码数据。Base64 格式需为 data:image/<格式>;base64,<编码>,格式名需小写,如 data:image/png;base64,...。 |
image_url.role | string | 条件必填 | 图片用途。first_frame:首帧图片,首帧图生视频时可不填或填此值;last_frame:尾帧图片,首尾帧图生视频时必填;reference_image:参考图片,仅 Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 支持,可传入 1~9 张。首帧图生视频、首尾帧图生视频和多模态参考生视频为互斥场景,不可混用。 |
- 格式:jpeg、png、webp、bmp、tiff、gif;
Doubao/Doubao-seedance-1.5-pro额外支持 heic、heif - 宽高比(宽/高):
(0.4, 2.5) - 像素尺寸:宽高均在
(300, 6000)px 范围内 - 大小:单张图片小于 30 MB,请求体总大小不超过 64 MB
- 多模态参考场景中,
Doubao/Doubao-seedance-2.0和Doubao/Doubao-seedance-2.0-fast最多支持 9 张参考图片
Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 不支持直接上传含真人人脸的参考图片或参考视频。若您使用首尾帧场景,首尾帧图片宽高比不一致时,以首帧为主,尾帧会自动裁剪适配。
参考图生视频支持直接用自然语言描述多张图片的组合关系。若希望获得更好的指令遵循效果,建议使用“[图1]...,[图2]...”的方式在提示词中显式指定各张图片的作用。
视频输入(type: "video_url"):
仅 Doubao/Doubao-seedance-2.0 和 Doubao/Doubao-seedance-2.0-fast 支持。
| 字段 | 类型 | 是否必填 | 说明 |
|---|---|---|---|
type | string | 是 | 固定值 "video_url"。 |
video_url.url | string |