wan2.6-i2v-flash 图生视频

根据首帧图像和文本提示词生成流畅视频
支持有声/无声切换、多镜头叙事、自定义音频
支持 720p/1080p 分辨率，2-15 秒时长
支持视频特效模板

curl --request POST \
  --url https://claw.dualseason.com/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.6-i2v-flash",
    "prompt": "人物转过头来微笑",
    "image_urls": ["https://example.com/portrait.jpg"],
    "resolution": "1080p",
    "duration": 5
  }'

{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

认证

Authorization

string

required

所有接口均需要使用 Bearer Token 进行认证获取 API Key：访问 API Key 管理页面获取您的 API Key使用时在请求头中添加：

Authorization: Bearer YOUR_API_KEY

请求参数

model

string

required

视频生成模型名称，可选值：wan2.6-i2v-flash、wan2.6-i2v

image_urls

array<string>

required

参考图片 URL 数组（仅支持 1 张首帧图片）支持公网可访问的图片 URL 或 Base64 编码（data:image/png;base64,...）示例：["https://example.com/image.jpg"]

图片要求：

格式：JPEG、JPG、PNG（不支持透明通道）、BMP、WEBP
分辨率：宽高范围 240-8000 像素
大小：≤ 10MB

prompt

string

视频内容描述图生视频时可选但建议填写，描述期望的动作和效果建议明确主体、动作、镜头和风格，以获得更好的生成效果示例："让图片中的人物微笑挥手，镜头缓缓推进"

negative_prompt

string

反向提示词，描述不希望出现的内容最多 500 字符示例："模糊, 低质量, 变形"

resolution

string

default:"1080p"

视频分辨率可选值：

720p - 标清
1080p - 高清（默认）

默认值：1080p

分辨率直接影响费用，1080p 单价高于 720p。图生视频时宽高比由输入图片决定。

duration

integer

default:"5"

视频时长（秒）支持范围：2 ~ 15 秒（整数）默认值：5

audio

boolean

default:"true"

是否生成有声视频设置为 true 时，自动生成匹配的背景音乐/音效（默认行为）设置为 false 时，输出无声视频默认值：true

当模型为 wan2.6-i2v 时，不支持该参数。

audio_url

string

自定义音频 URL（wav/mp3，3-30 秒，≤ 15MB）优先级低于 audio：当 audio=false 时即使传入也会被忽略若音频长度超过视频时长，自动截取；不足则超出部分为无声

音频文件要求：

格式：wav、mp3
时长：3-30 秒
大小：≤ 15MB

prompt_extend

boolean

default:"true"

是否开启 prompt 智能改写对较短提示词效果提升明显，但会增加耗时默认值：true

shot_type

string

镜头类型，需配合 prompt_extend=true 使用可选值：

single - 单镜头（默认），输出一个连续镜头的视频
multi - 多镜头，输出由多个镜头切换组成的叙事视频

shot_type 优先级高于 prompt。即使 prompt 中写了”多镜头”，设为 single 仍会输出单镜头。

seed

integer

随机种子（≥0），指定相同种子可复现相似结果示例：12345

watermark

boolean

default:"false"

是否添加 “AI生成” 水印（右下角）默认值：false

音频控制说明

参数组合	结果
不传 `audio` 和 `audio_url`	自动配音（默认）
`audio_url: "https://..."`	使用指定音频
`audio: false`	无声视频
`audio: false` + `audio_url: "..."`	无声视频（`audio` 优先级更高）

响应

code

integer

响应状态码，成功时为 200

data

array

返回数据数组

Show 数组元素

status

string

任务状态，初始提交时为 submitted

task_id

string

任务唯一标识符，用于查询任务状态和结果

使用场景

场景 1：最简请求

{
  "model": "wan2.6-i2v-flash",
  "image_urls": ["https://example.com/image.jpg"]
}

场景 2：完整参数

{
  "model": "wan2.6-i2v-flash",
  "prompt": "让图片中的人物微笑挥手，镜头缓缓推进",
  "image_urls": ["https://example.com/image.jpg"],
  "negative_prompt": "模糊, 低质量, 变形",
  "resolution": "1080p",
  "duration": 10,
  "seed": 12345,
  "prompt_extend": true,
  "shot_type": "multi",
  "audio": true,
  "watermark": false
}

场景 3：自定义音频

{
  "model": "wan2.6-i2v-flash",
  "prompt": "人物随着音乐起舞",
  "image_urls": ["https://example.com/dancer.jpg"],
  "audio_url": "https://example.com/music.mp3",
  "resolution": "1080p",
  "duration": 10
}

场景 4：无声视频

{
  "model": "wan2.6-i2v-flash",
  "prompt": "花朵缓缓绽放",
  "image_urls": ["https://example.com/flower.jpg"],
  "audio": false,
  "resolution": "720p",
  "duration": 5
}

场景 5：使用特效模板

{
  "model": "wan2.6-i2v-flash",
  "image_urls": ["https://example.com/person.jpg"],
  "template": "flying",
  "resolution": "720p"
}

场景 6：Base64 图片

{
  "model": "wan2.6-i2v-flash",
  "prompt": "让猫咪站起来走动",
  "image_urls": ["data:image/png;base64,iVBORw0KGgo..."],
  "duration": 5
}

查询任务结果视频生成为异步任务，提交后会返回 task_id。使用获取任务状态接口查询生成进度和结果。

概览

文本

图像

视频

音频

账户与工具

wan2.6-i2v-flash 图生视频

认证

请求参数

音频控制说明

响应

使用场景

场景 1：最简请求

场景 2：完整参数

场景 3：自定义音频

场景 4：无声视频

场景 5：使用特效模板

场景 6：Base64 图片

概览

文本

图像

视频

音频

账户与工具

​认证

​请求参数

​音频控制说明

​响应

​使用场景

​场景 1：最简请求

​场景 2：完整参数

​场景 3：自定义音频

​场景 4：无声视频

​场景 5：使用特效模板

​场景 6：Base64 图片

认证

请求参数

音频控制说明

响应

使用场景

场景 1：最简请求

场景 2：完整参数

场景 3：自定义音频

场景 4：无声视频

场景 5：使用特效模板

场景 6：Base64 图片