Runbase

Command Palette

Search for a command to run...

ByteDance

Seedance 1.5 Pro

ID:bytedance/seedance-1.5-pro

ByteDance 的 Seedance 1.5 Pro 影片產生 API — 電影級影片,支援同步音訊、多語言對白,最高 1080p。

文字轉影片圖片轉影片音訊產生多語言1080p
輸入
Aspect ratio
Resolution
Duration
Generate audio
Source images
最多 2 張圖片,每張 10MB
輸出結果會顯示在這裡
480p
$0.26
720p
$0.52
1080p
$1.10
cURL
curl https://api.runbase.net/v1/runs \
  -H "Authorization: Bearer $RUNBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "bytedance/seedance-1.5-pro",
    "input": {
      "prompt": "A cinematic product photo of a ceramic lamp",
      "aspect_ratio": "1:1",
      "resolution": "1K"
    }
  }'

範例

對白場景

對白場景

16:9

A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech

圖片轉影片(來源)

圖片轉影片(來源)

16:9

Extreme close-up of an older person's face by a window, a single tear forming, soft natural light

圖片轉影片(結果)

圖片轉影片(結果)

16:9

The tear rolls slowly down the cheek, subtle facial movement, ambient room tone

概述

Seedance 1.5 Pro 是 ByteDance 首款支援原生音訊產生的影片模型,銜接了無聲的 1.0 系列和功能完整的 2.0 版本。可產生最高 1080p 的電影級影片,並支援多語言的同步對白、音效和環境音。模型接受最多兩張參考圖片用於圖片轉影片,可控制首幀和尾幀。時長固定為 4、8 或 12 秒。

使用情境

對白驅動的場景 — 訪談、獨白、同步語音的說明影片。多語言廣告素材,配音需要與畫面匹配。使用兩張參考圖片的圖片轉影片,可同時控制片段的開頭和結尾。帶有環境音效設計的短敘事內容。

輸入參數

所有參數都在執行請求的 input 物件中傳遞。

ParameterRequiredDescription
promptYes文字描述(3–2500 字元)
aspect_ratioNo預設 16:9。選項:16:99:164:33:41:121:9
resolutionNo預設 720p。選項:480p720p1080p
durationNo預設 4。選項:4s8s12s
generate_audioNo產生同步音訊。預設 false
image_urlsNo最多 2 張參考圖片(每張最大 10 MB)用於圖片轉影片

提示詞技巧

用場景描述寫對白,而非劇本台詞

與其引用台詞(「He says: Hello」),不如描述情境:「A man greets someone warmly at a doorstep, casual tone.」模型會從上下文推斷適當的對白。

善用雙圖片功能控制首尾幀

上傳一張首幀圖片和一張作為目標結尾的圖片。模型會在兩者之間插值產生動態,讓你更精確地控制片段的起承轉合。

限制

  • 提示詞上限較短(2500 字元),相比 Seedance 2.0 的 20000 字元
  • 僅有三種固定時長選項(4s、8s、12s)— 不支援任意長度
  • 提示詞最少 3 個字元
  • 啟用音訊產生會增加單次執行費用
  • 1080p 相較 720p 會大幅增加產生時間和費用

常見問題

音訊支援哪些語言?

模型可產生多語言對白和配音。語言從提示詞的上下文推斷 — 用目標語言撰寫場景描述,或明確指定語言。

1.5 Pro 和 2.0 有什麼差異?

Seedance 2.0 支援 4 到 15 秒的任意時長、20000 字元的提示詞上限,以及整體更高的畫質。1.5 Pro 限定在固定的 4/8/12 秒時長和 2500 字元。在 Runbase 上,1.5 Pro 接受最多兩張參考圖片(首幀和尾幀),而 2.0 僅接受一張首幀圖片。

可以關閉音訊只輸出影片嗎?

可以。generate_audio 參數預設為 false。不啟用即可獲得無聲影片輸出,與 1.0 系列相同。