- 支持文生视频 (Text-to-Video) 和图生视频 (Image-to-Video)
- 支持 480p/720p/1080p 分辨率,5 或 10 秒时长
- 支持自动扩展提示词、自动配音和自定义音频
认证
请求参数
视频生成模型名称,固定为
wan2.5-preview视频内容描述文生视频(无
image_urls)时必填,图生视频时可选但建议填写建议详细描述场景、动作、风格等示例:"夕阳下的海边公路,电影感镜头"参考图片 URL 数组(仅支持 1 张首帧图片)图生视频模式下必填,支持公网可访问的图片 URL 或 Base64 编码(
data:image/png;base64,...)示例:["https://example.com/image.jpg"]系统会根据请求中是否包含
image_urls 自动选择文生视频或图生视频模式。文生模式不要传 image_urls。反向提示词,描述不希望出现的内容最多 500 字符示例:
"模糊, 低质量, 变形"视频分辨率可选值:
480p- 标清,支持 size:16:9、9:16、1:1720p- 高清(默认),支持 size:16:9、9:16、1:1、4:3、3:41080p- 超清,支持 size:16:9、9:16、1:1、4:3、3:4
720p分辨率直接影响费用,1080p > 720p > 480p。
视频时长(秒)仅支持:
5 或 10 秒默认值:5画面宽高比,仅文生视频(无
image_urls)有效可选值取决于 resolution:480p:16:9- 横屏(默认)9:16- 竖屏1:1- 方形
16:9- 横屏(默认)9:16- 竖屏1:1- 方形4:3- 横屏3:4- 竖屏
16:9随机种子(≥0),指定相同种子可复现相似结果示例:
12345是否开启 prompt 智能改写对较短提示词效果提升明显,但会增加耗时默认值:
true是否自动添加音频启用后系统会为视频自动生成匹配的音频默认值:
true自定义音频 URL(wav/mp3,3-30 秒,≤ 15MB)若音频长度超过视频时长,自动截取;不足则超出部分为无声
是否添加 “AI生成” 水印(右下角)默认值:
false分辨率与宽高比组合
size 与 resolution 组合映射为上游像素尺寸(仅文生视频有效):
| 宽高比 | 说明 | 480p 尺寸 | 720p 尺寸 | 1080p 尺寸 |
|---|---|---|---|---|
16:9 | 横屏(默认) | 832×480 | 1280×720 | 1920×1080 |
9:16 | 竖屏 | 480×832 | 720×1280 | 1080×1920 |
1:1 | 方形 | 624×624 | 960×960 | 1440×1440 |
4:3 | 横屏 | - | 1088×832 | 1632×1248 |
3:4 | 竖屏 | - | 832×1088 | 1248×1632 |
480p 仅支持
16:9、9:16、1:1 三种比例,传 4:3 或 3:4 会报错。720p 和 1080p 支持全部 5 种比例。响应
响应状态码,成功时为 200
返回数据数组
使用场景
场景 1:文生视频(简单请求)
场景 2:文生视频(完整参数)
场景 3:图生视频
场景 4:图生视频(Base64 图片)
场景 5:自定义音频
模式说明
文生视频 (Text-to-Video)
- 必须提供
prompt参数 - 不需要
image_urls参数 - 可通过
size指定画面宽高比
图生视频 (Image-to-Video)
- 必须提供
image_urls参数(仅支持 1 张图片) prompt参数可选,用于描述期望的动作- 宽高比由输入图片决定,不要传
size
系统会根据请求中是否包含
image_urls 自动选择模式查询任务结果视频生成为异步任务,提交后会返回
task_id。使用 获取任务状态 接口查询生成进度和结果。
