
Image to Video (Résultat)
16:9An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics
bytedance/seedance-2API de génération vidéo Seedance 2.0 par ByteDance — jusqu'en 1080p avec audio natif et dialogues, image-to-video, et clips de 4 à 15 secondes.

An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics

An octopus resting beside a soccer ball on the ocean floor, sunlight filtering through the water
Seedance 2.0 est le modèle vidéo de deuxième génération de ByteDance, sorti en février 2026. Il génère des vidéos avec audio natif — dialogues, effets sonores et bruits ambiants sont produits en même temps que les visuels en une seule passe, éliminant le besoin de post-production audio séparée. Le modèle alimente les fonctionnalités de vidéo IA dans CapCut et Dreamina.
Révélations de produits et animations d'unboxing pour le e-commerce. Reels et contenus courts pour les réseaux sociaux avec bandes sonores assorties. Conversion image-to-video — chargez un visuel fixe et animez-le avec du mouvement et un audio optionnel. Clips narratifs avec dialogues parlés pour la publicité ou les contenus explicatifs.
Tous les paramètres sont passés dans l'objet input de la requête d'exécution.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | Description textuelle (3–20000 caractères) |
| aspect_ratio | No | Par défaut 16:9. Options : 1:1, 3:4, 4:3, 9:16, 16:9, 21:9 |
| resolution | No | Par défaut 720p. Options : 480p, 720p, 1080p |
| duration | No | Durée de la vidéo en secondes (4–15). Par défaut 5 |
| generate_audio | No | Générer une piste audio. Par défaut false |
| image_urls | No | Image de première frame (max 1, max 10 MB) pour l'image-to-video |
Seedance 2.0 réagit bien aux directions cinématographiques. Des expressions comme « slow dolly forward », « overhead tracking shot » ou « quick cut to close-up » améliorent la cohérence.
Quand generate_audio est activé, le modèle déduit l'audio de la description de la scène. Écrivez des prompts qui impliquent le son — « rain hitting a window », « footsteps on gravel » — plutôt que de décrire l'audio directement.
Les clips courts (4–5s) fonctionnent mieux pour les plans à action unique. Pour les séquences avec des transitions de caméra ou des temps narratifs, poussez vers 10–15 secondes.
Oui. Réglez generate_audio sur true et le modèle produit des dialogues synchronisés, des effets sonores et un audio ambiant en une seule passe. Cela s'ajoute au coût par exécution.
15 secondes. Vous pouvez définir n'importe quel entier de 4 à 15 via le paramètre duration. La valeur par défaut est 5 secondes.
Oui. Chargez une image de première frame via image_urls et le modèle génère une vidéo à partir de cette image.