
Dialogszene
16:9A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech
bytedance/seedance-1.5-proSeedance 1.5 Pro Videoerzeugung-API von ByteDance — Kinoqualität-Video mit synchronisiertem Audio, mehrsprachigem Dialog und bis zu 1080p.
curl https://api.runbase.net/v1/runs \
-H "Authorization: Bearer $RUNBASE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance/seedance-1.5-pro",
"input": {
"prompt": "A cinematic product photo of a ceramic lamp",
"aspect_ratio": "1:1",
"resolution": "1K"
}
}'
A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech

Extreme close-up of an older person's face by a window, a single tear forming, soft natural light

The tear rolls slowly down the cheek, subtle facial movement, ambient room tone
Seedance 1.5 Pro ist ByteDances erstes Videomodell mit nativer Audioerzeugung und schließt die Lücke zwischen der stummen 1.0-Serie und dem vollausgestatteten 2.0-Release. Es erzeugt Video in Kinoqualität bei bis zu 1080p mit synchronisiertem Dialog, Soundeffekten und Umgebungsaudio in mehreren Sprachen. Das Modell akzeptiert bis zu zwei Referenzbilder für Bild-zu-Video und ermöglicht so die Steuerung des ersten und letzten Frames. Die Dauer ist auf 4, 8 oder 12 Sekunden festgelegt.
Dialoggetriebene Szenen — Interviews, Monologe, Erklärvideos mit synchronisierter Sprache. Mehrsprachige Werbemittel, bei denen der Voiceover zu den Bildern passen muss. Bild-zu-Video mit zwei Referenzframes zur Steuerung von Anfang und Ende eines Clips. Kurze narrative Inhalte mit Ambient-Sound-Design.
Alle Parameter werden im input-Objekt des Run-Requests übergeben.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | Textbeschreibung (3–2500 Zeichen) |
| aspect_ratio | No | Standard 16:9. Optionen: 16:9, 9:16, 4:3, 3:4, 1:1, 21:9 |
| resolution | No | Standard 720p. Optionen: 480p, 720p, 1080p |
| duration | No | Standard 4. Optionen: 4s, 8s, 12s |
| generate_audio | No | Synchronisiertes Audio erzeugen. Standard false |
| image_urls | No | Bis zu 2 Referenzbilder (max. 10 MB pro Bild) für Bild-zu-Video |
Statt wörtliche Rede zu zitieren („He says: Hello"), beschreiben Sie das Szenario: „A man greets someone warmly at a doorstep, casual tone." Das Modell leitet passende Dialoge aus dem Kontext ab.
Laden Sie ein Bild für den ersten Frame und ein zweites Bild als Ziel-Endzustand hoch. Das Modell interpoliert die Bewegung dazwischen und gibt Ihnen mehr Kontrolle über den Verlauf des Clips.
Das Modell erzeugt mehrsprachige Dialoge und Voiceover. Die Sprache wird aus dem Prompt-Kontext abgeleitet — schreiben Sie Ihre Szenenbeschreibung in der Zielsprache oder geben Sie die Sprache explizit an.
Seedance 2.0 unterstützt beliebige Dauern von 4 bis 15 Sekunden, eine Prompt-Obergrenze von 20000 Zeichen und generell eine höhere visuelle Qualität. 1.5 Pro ist auf feste 4/8/12s-Dauern und 2500 Zeichen begrenzt. Auf Runbase akzeptiert 1.5 Pro bis zu zwei Referenzbilder (erster und letzter Frame), während 2.0 ein einzelnes Bild für den ersten Frame nutzt.
Ja. Der Parameter generate_audio ist standardmäßig false. Lassen Sie ihn deaktiviert, um stumme Videoausgabe zu erhalten, wie bei den 1.0-Modellen.