跳到主要内容

素材管理概述

在生成真人视频时,若使用涉及人物肖像的人像图片素材,通常需要先完成素材审核,审核通过后才可在视频生成任务中引用。融云 AI 服务提供了素材管理接口,用于提交素材、查询审核状态,并按 API Key 对不同客户的数据进行隔离。

适用场景

  • 使用真人图片作为视频生成的参考素材前,需要先上传并发起审核。
  • 需要查询素材当前是否已审核通过。
  • 需要按当前 API Key 所属应用管理本应用自己的素材记录。

鉴权与隔离

  • 本组接口与现有 AI 接口共用 API Key 鉴权。
  • 融云会根据 API Key 自动识别所属应用,素材数据按应用隔离。
  • 素材列表和素材详情仅返回当前应用下的素材记录。

使用流程

  1. 调用上传素材并发起审核接口,提交待审核的人像图片素材。
  2. 调用查询素材详情批量查询素材接口,轮询素材审核状态。
  3. 当返回的 volcengine_statusActive 时,表示素材已审核通过,可在创建视频生成任务接口中通过 asset://{asset_id} 引用该素材。

上传素材文件要求

上传素材前,请先确认源文件满足以下约束;否则素材可能无法受理,或审核失败。

单个图像要求

  • 格式:jpegpngwebpbmptiffgifheicheif
  • 宽高比(宽/高):(0.4, 2.5)
  • 像素尺寸:宽高均在 (300, 6000) px 范围内
  • 大小:单张图片小于 30 MB

单个视频要求

  • 格式:mp4mov
  • 分辨率:480p720p
  • 时长:单个视频时长在 [2, 15] 秒之间
  • 宽高比(宽/高):[0.4, 2.5]
  • 像素尺寸:宽高均在 [300, 6000] px 范围内
  • 总像素数:宽和高的乘积需在 [409600, 927408] 区间内,即 [640 × 640, 834 × 1112]
  • 大小:单个视频不超过 50 MB
  • 帧率:[24, 60] FPS

单个音频要求

  • 格式:wavmp3
  • 时长:单个音频时长在 [2, 15] 秒之间
  • 大小:单个音频不超过 15 MB

审核状态说明

状态值说明
Processing素材已受理,正在处理或审核中。
Active素材已审核通过,可以在视频生成任务中引用。
Failed素材未通过审核,当前不可用于视频生成。

在视频生成接口中引用素材

当素材审核通过后,可将素材 ID 按 asset://{asset_id} 的格式传入视频生成请求中对应的素材字段。例如:

JSON
{
"model": "Doubao/Doubao-seedance-2.0",
"content": [
{
"type": "text",
"text": "人物保持自然站姿,镜头缓慢推进。"
},
{
"type": "image_url",
"image_url": {
"url": "asset://asset-20260416160625-h123p",
"role": "reference_image"
}
}
]
}

接口列表