
Scena di dialogo
16:9A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech
bytedance/seedance-1.5-proAPI di generazione video Seedance 1.5 Pro di ByteDance — video di qualità cinematografica con audio sincronizzato, dialoghi multilingue e fino a 1080p.
curl https://api.runbase.net/v1/runs \
-H "Authorization: Bearer $RUNBASE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance/seedance-1.5-pro",
"input": {
"prompt": "A cinematic product photo of a ceramic lamp",
"aspect_ratio": "1:1",
"resolution": "1K"
}
}'
A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech

Extreme close-up of an older person's face by a window, a single tear forming, soft natural light

The tear rolls slowly down the cheek, subtle facial movement, ambient room tone
Seedance 1.5 Pro è il primo modello video di ByteDance con generazione audio nativa, che colma il divario tra la serie 1.0 senza audio e la release 2.0 completa. Produce video di qualità cinematografica fino a 1080p con dialoghi sincronizzati, effetti sonori e audio ambientale in più lingue. Il modello accetta fino a due immagini di riferimento per image-to-video, consentendo il controllo del primo e dell'ultimo fotogramma. Le durate sono fisse a 4, 8 o 12 secondi.
Scene con dialoghi — interviste, monologhi, video esplicativi con parlato sincronizzato. Creatività pubblicitarie multilingue in cui il voiceover deve corrispondere alle immagini. Image-to-video con due fotogrammi di riferimento per controllare inizio e fine di una clip. Contenuti narrativi brevi con design sonoro ambientale.
Tutti i parametri vengono passati nell'oggetto input della richiesta di esecuzione.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | Descrizione testuale (3–2500 caratteri) |
| aspect_ratio | No | Default 16:9. Opzioni: 16:9, 9:16, 4:3, 3:4, 1:1, 21:9 |
| resolution | No | Default 720p. Opzioni: 480p, 720p, 1080p |
| duration | No | Default 4. Opzioni: 4s, 8s, 12s |
| generate_audio | No | Genera audio sincronizzato. Default false |
| image_urls | No | Fino a 2 immagini di riferimento (max 10 MB ciascuna) per image-to-video |
Anziché citare il parlato ("He says: Hello"), descrivi lo scenario: "A man greets someone warmly at a doorstep, casual tone." Il modello inferisce il dialogo appropriato dal contesto.
Carica un'immagine per il primo fotogramma e una seconda immagine come stato finale desiderato. Il modello interpola il movimento tra le due, dandoti un controllo più preciso sull'arco narrativo della clip.
Il modello genera dialoghi e voiceover multilingue. La lingua viene inferita dal contesto del prompt — scrivi la descrizione della scena nella lingua di destinazione o specifica la lingua esplicitamente.
Seedance 2.0 supporta durate arbitrarie da 4 a 15 secondi, un limite prompt di 20000 caratteri e in generale una fedeltà visiva superiore. 1.5 Pro è limitato a durate fisse 4/8/12s e 2500 caratteri. Su Runbase, 1.5 Pro accetta fino a due immagini di riferimento (primo e ultimo fotogramma), mentre 2.0 ne accetta una singola come primo fotogramma.
Sì. Il parametro generate_audio è impostato su false di default. Lascialo disattivato per ottenere video senza audio, come i modelli 1.0.