Runbase

概述

Seedance 1.5 Pro 是 ByteDance 首款支援原生音訊產生的影片模型，銜接了無聲的 1.0 系列和功能完整的 2.0 版本。可產生最高 1080p 的電影級影片，並支援多語言的同步對白、音效和環境音。模型接受最多兩張參考圖片用於圖片轉影片，可控制首幀和尾幀。時長固定為 4、8 或 12 秒。

使用情境

對白驅動的場景 — 訪談、獨白、同步語音的說明影片。多語言廣告素材，配音需要與畫面匹配。使用兩張參考圖片的圖片轉影片，可同時控制片段的開頭和結尾。帶有環境音效設計的短敘事內容。

輸入參數

所有參數都在執行請求的 input 物件中傳遞。

Parameter	Required	Description
prompt	Yes	文字描述（3–2500 字元）
aspect_ratio	No	預設 `16:9`。選項：`16:9`、`9:16`、`4:3`、`3:4`、`1:1`、`21:9`
resolution	No	預設 `720p`。選項：`480p`、`720p`、`1080p`
duration	No	預設 `4`。選項：`4s`、`8s`、`12s`
generate_audio	No	產生同步音訊。預設 `false`
image_urls	No	最多 2 張參考圖片（每張最大 10 MB）用於圖片轉影片

提示詞技巧

用場景描述寫對白，而非劇本台詞

與其引用台詞（「He says: Hello」），不如描述情境：「A man greets someone warmly at a doorstep, casual tone.」模型會從上下文推斷適當的對白。

善用雙圖片功能控制首尾幀

上傳一張首幀圖片和一張作為目標結尾的圖片。模型會在兩者之間插值產生動態，讓你更精確地控制片段的起承轉合。

限制

提示詞上限較短（2500 字元），相比 Seedance 2.0 的 20000 字元
僅有三種固定時長選項（4s、8s、12s）— 不支援任意長度
提示詞最少 3 個字元
啟用音訊產生會增加單次執行費用
1080p 相較 720p 會大幅增加產生時間和費用

常見問題

音訊支援哪些語言？

模型可產生多語言對白和配音。語言從提示詞的上下文推斷 — 用目標語言撰寫場景描述，或明確指定語言。

1.5 Pro 和 2.0 有什麼差異？

Seedance 2.0 支援 4 到 15 秒的任意時長、20000 字元的提示詞上限，以及整體更高的畫質。1.5 Pro 限定在固定的 4/8/12 秒時長和 2500 字元。在 Runbase 上，1.5 Pro 接受最多兩張參考圖片（首幀和尾幀），而 2.0 僅接受一張首幀圖片。

可以關閉音訊只輸出影片嗎？

可以。generate_audio 參數預設為 false。不啟用即可獲得無聲影片輸出，與 1.0 系列相同。

Seedance 1.5 Pro

範例

對白場景

圖片轉影片（來源）

圖片轉影片（結果）

概述