Runbase

Command Palette

Search for a command to run...

ByteDance

Seedance 2.0

ID:bytedance/seedance-2

ByteDance 推出的 Seedance 2.0 视频生成 API —— 最高 1080p,支持原生音频与对话、图生视频,片段时长 4 到 15 秒。

文生视频图生视频音频生成1080p
输入
Aspect ratio
Resolution
Duration (seconds)5
Generate audio
First frame image
最多 1 张图片,每张不超过 10MB
输出将显示在此处

定价

480p
$0.12/秒
720p
$0.27/秒
1080p
$0.66/秒

示例

图生视频(结果)

图生视频(结果)

16:9

An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics

图生视频(源图)

图生视频(源图)

16:9

An octopus resting beside a soccer ball on the ocean floor, sunlight filtering through the water

概述

Seedance 2.0 是 ByteDance 的第二代视频模型,于 2026 年 2 月发布。它可生成带有原生音频的视频——对话、音效和环境噪声与画面在单次生成中同步产出,无需单独的音频后期处理。该模型为 CapCut 和 Dreamina 的 AI 视频功能提供支持。

使用场景

电商产品展示和开箱动画。带配乐的社交媒体短视频。图生视频——上传静态图并为其添加动效和可选音频。带口播对话的叙事片段,适用于广告或讲解内容。

输入参数

所有参数通过运行请求的 input 对象传入。

ParameterRequiredDescription
promptYes文本描述(3–20000 字符)
aspect_ratioNo默认 16:9。可选:1:13:44:39:1616:921:9
resolutionNo默认 720p。可选:480p720p1080p
durationNo视频时长(秒),范围 4–15。默认 5
generate_audioNo生成音频轨道。默认 false
image_urlsNo首帧图片(最多 1 张,最大 10 MB)用于图生视频

提示词技巧

描述镜头运动和场景节奏

Seedance 2.0 对电影化指令响应良好。"slow dolly forward"、"overhead tracking shot"、"quick cut to close-up" 等短语能提升连贯性。

音频提示要用画面来暗示

启用 generate_audio 后,模型会从场景描述中推断音频。用暗示声音的方式来写提示词——"rain hitting a window"、"footsteps on gravel"——而不是直接描述音频本身。

灵活利用时长范围

短片段(4–5s)最适合单一动作。包含镜头转场或叙事节拍的序列,可以拉长到 10–15 秒。

限制

  • 单次生成最长 15 秒
  • 开启音频生成会增加额度消耗
  • 提示词最少 3 个字符
  • 图生视频仅支持一张首帧图片(最大 10 MB)
  • 1080p 相比 720p 会显著增加生成时间和成本

常见问题

Seedance 2.0 支持音频生成吗?

支持。将 generate_audio 设为 true,模型会在一次生成中同步产出对话、音效和环境音。这会增加单次运行的成本。

视频最长多少?

15 秒。你可以通过 duration 参数设置 4 到 15 之间的任意整数。默认为 5 秒。

可以为静态图添加动效吗?

可以。通过 image_urls 上传一张首帧图片,模型会以该帧为起点生成视频。