- 根据首帧图像和文本提示词生成流畅视频
- 支持有声/无声切换、多镜头叙事、自定义音频
- 支持 720p/1080p 分辨率,2-15 秒时长
- 支持视频特效模板
认证
请求参数
视频生成模型名称,可选值:
wan2.6-i2v-flash、wan2.6-i2v参考图片 URL 数组(仅支持 1 张首帧图片)支持公网可访问的图片 URL 或 Base64 编码(
data:image/png;base64,...)示例:["https://example.com/image.jpg"]图片要求:
- 格式:JPEG、JPG、PNG(不支持透明通道)、BMP、WEBP
- 分辨率:宽高范围 240-8000 像素
- 大小:≤ 10MB
视频内容描述图生视频时可选但建议填写,描述期望的动作和效果建议明确主体、动作、镜头和风格,以获得更好的生成效果示例:
"让图片中的人物微笑挥手,镜头缓缓推进"反向提示词,描述不希望出现的内容最多 500 字符示例:
"模糊, 低质量, 变形"视频分辨率可选值:
720p- 标清1080p- 高清(默认)
1080p分辨率直接影响费用,1080p 单价高于 720p。图生视频时宽高比由输入图片决定。
视频时长(秒)支持范围:
2 ~ 15 秒(整数)默认值:5是否生成有声视频设置为
true 时,自动生成匹配的背景音乐/音效(默认行为)设置为 false 时,输出无声视频默认值:true当模型为
wan2.6-i2v 时,不支持该参数。自定义音频 URL(wav/mp3,3-30 秒,≤ 15MB)优先级低于
audio:当 audio=false 时即使传入也会被忽略若音频长度超过视频时长,自动截取;不足则超出部分为无声是否开启 prompt 智能改写对较短提示词效果提升明显,但会增加耗时默认值:
true镜头类型,需配合
prompt_extend=true 使用可选值:single- 单镜头(默认),输出一个连续镜头的视频multi- 多镜头,输出由多个镜头切换组成的叙事视频
shot_type 优先级高于 prompt。即使 prompt 中写了”多镜头”,设为 single 仍会输出单镜头。随机种子(≥0),指定相同种子可复现相似结果示例:
12345是否添加 “AI生成” 水印(右下角)默认值:
false音频控制说明
| 参数组合 | 结果 |
|---|---|
不传 audio 和 audio_url | 自动配音(默认) |
audio_url: "https://..." | 使用指定音频 |
audio: false | 无声视频 |
audio: false + audio_url: "..." | 无声视频(audio 优先级更高) |
响应
响应状态码,成功时为 200
返回数据数组
使用场景
场景 1:最简请求
场景 2:完整参数
场景 3:自定义音频
场景 4:无声视频
场景 5:使用特效模板
场景 6:Base64 图片
查询任务结果视频生成为异步任务,提交后会返回
task_id。使用 获取任务状态 接口查询生成进度和结果。
