Runbase

Panoramica

Seedance 1.5 Pro è il primo modello video di ByteDance con generazione audio nativa, che colma il divario tra la serie 1.0 senza audio e la release 2.0 completa. Produce video di qualità cinematografica fino a 1080p con dialoghi sincronizzati, effetti sonori e audio ambientale in più lingue. Il modello accetta fino a due immagini di riferimento per image-to-video, consentendo il controllo del primo e dell'ultimo fotogramma. Le durate sono fisse a 4, 8 o 12 secondi.

Casi d'uso

Scene con dialoghi — interviste, monologhi, video esplicativi con parlato sincronizzato. Creatività pubblicitarie multilingue in cui il voiceover deve corrispondere alle immagini. Image-to-video con due fotogrammi di riferimento per controllare inizio e fine di una clip. Contenuti narrativi brevi con design sonoro ambientale.

Input

Tutti i parametri vengono passati nell'oggetto input della richiesta di esecuzione.

Parameter	Required	Description
prompt	Yes	Descrizione testuale (3–2500 caratteri)
aspect_ratio	No	Default `16:9`. Opzioni: `16:9`, `9:16`, `4:3`, `3:4`, `1:1`, `21:9`
resolution	No	Default `720p`. Opzioni: `480p`, `720p`, `1080p`
duration	No	Default `4`. Opzioni: `4s`, `8s`, `12s`
generate_audio	No	Genera audio sincronizzato. Default `false`
image_urls	No	Fino a 2 immagini di riferimento (max 10 MB ciascuna) per image-to-video

Suggerimenti per i prompt

Scrivi i dialoghi come indicazioni di scena, non come copione

Anziché citare il parlato ("He says: Hello"), descrivi lo scenario: "A man greets someone warmly at a doorstep, casual tone." Il modello inferisce il dialogo appropriato dal contesto.

Usa i due slot immagine per il frame iniziale e finale

Carica un'immagine per il primo fotogramma e una seconda immagine come stato finale desiderato. Il modello interpola il movimento tra le due, dandoti un controllo più preciso sull'arco narrativo della clip.

Limitazioni

Limite prompt più breve (2500 caratteri) rispetto ai 20000 di Seedance 2.0
Solo tre opzioni di durata fissa (4s, 8s, 12s) — nessuna lunghezza arbitraria
Il prompt deve avere minimo 3 caratteri
La generazione audio aumenta il costo per esecuzione
1080p aumenta significativamente tempi di generazione e costo rispetto a 720p

FAQ

Quali lingue supporta l'audio?

Il modello genera dialoghi e voiceover multilingue. La lingua viene inferita dal contesto del prompt — scrivi la descrizione della scena nella lingua di destinazione o specifica la lingua esplicitamente.

Che differenza c'è tra 1.5 Pro e 2.0?

Seedance 2.0 supporta durate arbitrarie da 4 a 15 secondi, un limite prompt di 20000 caratteri e in generale una fedeltà visiva superiore. 1.5 Pro è limitato a durate fisse 4/8/12s e 2500 caratteri. Su Runbase, 1.5 Pro accetta fino a due immagini di riferimento (primo e ultimo fotogramma), mentre 2.0 ne accetta una singola come primo fotogramma.

Posso disattivare l'audio e ottenere solo il video?

Sì. Il parametro generate_audio è impostato su false di default. Lascialo disattivato per ottenere video senza audio, come i modelli 1.0.

Seedance 1.5 Pro

Esempi

Scena di dialogo

Image to Video (Sorgente)

Image to Video (Risultato)