Runbase

Übersicht

Seedance 1.5 Pro ist ByteDances erstes Videomodell mit nativer Audioerzeugung und schließt die Lücke zwischen der stummen 1.0-Serie und dem vollausgestatteten 2.0-Release. Es erzeugt Video in Kinoqualität bei bis zu 1080p mit synchronisiertem Dialog, Soundeffekten und Umgebungsaudio in mehreren Sprachen. Das Modell akzeptiert bis zu zwei Referenzbilder für Bild-zu-Video und ermöglicht so die Steuerung des ersten und letzten Frames. Die Dauer ist auf 4, 8 oder 12 Sekunden festgelegt.

Anwendungsfälle

Dialoggetriebene Szenen — Interviews, Monologe, Erklärvideos mit synchronisierter Sprache. Mehrsprachige Werbemittel, bei denen der Voiceover zu den Bildern passen muss. Bild-zu-Video mit zwei Referenzframes zur Steuerung von Anfang und Ende eines Clips. Kurze narrative Inhalte mit Ambient-Sound-Design.

Eingaben

Alle Parameter werden im input-Objekt des Run-Requests übergeben.

Parameter	Required	Description
prompt	Yes	Textbeschreibung (3–2500 Zeichen)
aspect_ratio	No	Standard `16:9`. Optionen: `16:9`, `9:16`, `4:3`, `3:4`, `1:1`, `21:9`
resolution	No	Standard `720p`. Optionen: `480p`, `720p`, `1080p`
duration	No	Standard `4`. Optionen: `4s`, `8s`, `12s`
generate_audio	No	Synchronisiertes Audio erzeugen. Standard `false`
image_urls	No	Bis zu 2 Referenzbilder (max. 10 MB pro Bild) für Bild-zu-Video

Prompt-Tipps

Dialog als Szenenanweisung schreiben, nicht als Skript

Statt wörtliche Rede zu zitieren („He says: Hello"), beschreiben Sie das Szenario: „A man greets someone warmly at a doorstep, casual tone." Das Modell leitet passende Dialoge aus dem Kontext ab.

Zwei Bilder für Start-/End-Framing nutzen

Laden Sie ein Bild für den ersten Frame und ein zweites Bild als Ziel-Endzustand hoch. Das Modell interpoliert die Bewegung dazwischen und gibt Ihnen mehr Kontrolle über den Verlauf des Clips.

Einschränkungen

Kürzere Prompt-Obergrenze (2500 Zeichen) im Vergleich zu Seedance 2.0 mit 20000
Nur drei feste Daueroptionen (4s, 8s, 12s) — keine beliebige Länge
Mindestlänge des Prompts ist 3 Zeichen
Audioerzeugung erhöht die Kosten pro Ausführung
1080p erhöht die Generierungszeit und Kosten deutlich im Vergleich zu 720p

Häufige Fragen

Welche Sprachen unterstützt das Audio?

Das Modell erzeugt mehrsprachige Dialoge und Voiceover. Die Sprache wird aus dem Prompt-Kontext abgeleitet — schreiben Sie Ihre Szenenbeschreibung in der Zielsprache oder geben Sie die Sprache explizit an.

Wie unterscheidet sich 1.5 Pro von 2.0?

Seedance 2.0 unterstützt beliebige Dauern von 4 bis 15 Sekunden, eine Prompt-Obergrenze von 20000 Zeichen und generell eine höhere visuelle Qualität. 1.5 Pro ist auf feste 4/8/12s-Dauern und 2500 Zeichen begrenzt. Auf Runbase akzeptiert 1.5 Pro bis zu zwei Referenzbilder (erster und letzter Frame), während 2.0 ein einzelnes Bild für den ersten Frame nutzt.

Kann ich Audio deaktivieren und nur Video erhalten?

Ja. Der Parameter generate_audio ist standardmäßig false. Lassen Sie ihn deaktiviert, um stumme Videoausgabe zu erhalten, wie bei den 1.0-Modellen.

Seedance 1.5 Pro

Beispiele

Dialogszene

Bild zu Video (Quelle)

Bild zu Video (Ergebnis)