
图生视频(结果)
16:9An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics
bytedance/seedance-2ByteDance 推出的 Seedance 2.0 视频生成 API —— 最高 1080p,支持原生音频与对话、图生视频,片段时长 4 到 15 秒。

An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics

An octopus resting beside a soccer ball on the ocean floor, sunlight filtering through the water
Seedance 2.0 是 ByteDance 的第二代视频模型,于 2026 年 2 月发布。它可生成带有原生音频的视频——对话、音效和环境噪声与画面在单次生成中同步产出,无需单独的音频后期处理。该模型为 CapCut 和 Dreamina 的 AI 视频功能提供支持。
电商产品展示和开箱动画。带配乐的社交媒体短视频。图生视频——上传静态图并为其添加动效和可选音频。带口播对话的叙事片段,适用于广告或讲解内容。
所有参数通过运行请求的 input 对象传入。
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | 文本描述(3–20000 字符) |
| aspect_ratio | No | 默认 16:9。可选:1:1、3:4、4:3、9:16、16:9、21:9 |
| resolution | No | 默认 720p。可选:480p、720p、1080p |
| duration | No | 视频时长(秒),范围 4–15。默认 5 |
| generate_audio | No | 生成音频轨道。默认 false |
| image_urls | No | 首帧图片(最多 1 张,最大 10 MB)用于图生视频 |
Seedance 2.0 对电影化指令响应良好。"slow dolly forward"、"overhead tracking shot"、"quick cut to close-up" 等短语能提升连贯性。
启用 generate_audio 后,模型会从场景描述中推断音频。用暗示声音的方式来写提示词——"rain hitting a window"、"footsteps on gravel"——而不是直接描述音频本身。
短片段(4–5s)最适合单一动作。包含镜头转场或叙事节拍的序列,可以拉长到 10–15 秒。
支持。将 generate_audio 设为 true,模型会在一次生成中同步产出对话、音效和环境音。这会增加单次运行的成本。
15 秒。你可以通过 duration 参数设置 4 到 15 之间的任意整数。默认为 5 秒。
可以。通过 image_urls 上传一张首帧图片,模型会以该帧为起点生成视频。