- 支持文本转视频、图生视频(首帧/首尾帧控制)
- 支持标准模式(720P)和专业模式(1080P)
- 专业模式支持自动音频生成和指定音色
认证
请求参数
视频生成模型名称支持的模型:
kling-v2-6- 可灵 v2.6(推荐)
正向文本提示词,不能超过 2500 个字符建议详细描述场景、动作、风格等,以获得更好的生成效果示例:
"一只金色的猫咪在阳光下的草地上奔跑,慢动作,电影质感"生成模式可选值:
std- 标准模式(720P,仅支持无声视频)pro- 专业模式(1080P,支持自动音频生成)
std视频时长(秒)可选值:
5 或 10默认值:5视频宽高比可选值:
16:9- 横屏9:16- 竖屏1:1- 方形
16:9负面提示词,用于排除不想要的内容示例:
"模糊, 低画质, 变形"图片 URL 数组,用于图生视频
- 传 1 张:作为首帧图片
- 传 2 张:自动分配为首帧 + 尾帧(需
mode: "pro")
["https://example.com/first.jpg"]是否自动生成音频默认值:
false是否添加水印
功能支持矩阵
| 类型 | 功能 | std 5s | std 10s | pro 5s | pro 10s |
|---|---|---|---|---|---|
| 文生视频 | 视频生成 | ✅(仅无声) | ✅(仅无声) | ✅ | ✅ |
| 文生视频 | 自动音频 | - | - | ✅ | ✅ |
| 图生视频 | 视频生成 | ✅(仅无声) | ✅(仅无声) | ✅ | ✅ |
| 图生视频 | 首帧 | ✅ | ✅ | ✅ | ✅ |
| 图生视频 | 尾帧 | - | - | ✅ | ✅ |
| 图生视频 | 自动音频 | - | - | ✅ | ✅ |
注意:在 pro 模式下,尾帧和声音控制不能同时使用,二者互斥。
文生视频 vs 图生视频
系统通过是否传入image_urls 自动判断模式:不传图片为文生视频,传图片为图生视频。
| 参数 | 文生视频 | 图生视频 |
|---|---|---|
prompt | ✅ 必填 | ✅ 必填 |
image_urls | ❌ 不传 | ✅ 必填(1-2 张,尾帧需 pro) |
negative_prompt | ✅ 可选 | ✅ 可选 |
mode | ✅ 可选 | ✅ 可选 |
duration | ✅ 可选 | ✅ 可选 |
aspect_ratio | ✅ 可选 | ⚠️ 可能被图片比例覆盖 |
audio | ✅ 可选(需 pro) | ✅ 可选(需 pro) |
watermark | ✅ 可选 | ✅ 可选 |
响应
响应状态码,成功时为 200
返回数据数组
使用场景
场景 1:文生视频(标准模式)
场景 2:文生视频(专业模式 + 负面提示词)
场景 3:图生视频(首帧图片)
场景 4:图生视频(首帧 + 尾帧控制)
场景 5:专业模式 + 自动音频
查询任务结果视频生成为异步任务,提交后会返回
task_id。使用 获取任务状态 接口查询生成进度和结果。
