
Chuyển hình ảnh thành video (Kết quả)
16:9An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics
bytedance/seedance-2API tạo video Seedance 2.0 của ByteDance — lên đến 1080p với âm thanh và hội thoại tích hợp, chuyển hình ảnh thành video, và clip từ 4 đến 15 giây.

An octopus on the sandy seafloor wrapping its arms around a soccer ball, clear blue water, realistic underwater physics

An octopus resting beside a soccer ball on the ocean floor, sunlight filtering through the water
Seedance 2.0 là mô hình video thế hệ thứ hai của ByteDance, ra mắt vào tháng 2 năm 2026. Mô hình tạo video với âm thanh tích hợp — hội thoại, hiệu ứng âm thanh và tiếng nền được tạo cùng lúc với hình ảnh trong một lần xử lý, loại bỏ nhu cầu hậu kỳ âm thanh riêng biệt. Mô hình này cung cấp các tính năng video AI trong CapCut và Dreamina.
Phát hành sản phẩm và hoạt ảnh mở hộp cho thương mại điện tử. Video ngắn cho mạng xã hội và nội dung ngắn với nhạc nền phù hợp. Chuyển hình ảnh thành video — tải lên ảnh tĩnh và tạo chuyển động với âm thanh tùy chọn. Clip tường thuật có hội thoại cho quảng cáo hoặc nội dung giải thích.
Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | Mô tả văn bản (3–20000 ký tự) |
| aspect_ratio | No | Mặc định 16:9. Tùy chọn: 1:1, 3:4, 4:3, 9:16, 16:9, 21:9 |
| resolution | No | Mặc định 720p. Tùy chọn: 480p, 720p, 1080p |
| duration | No | Thời lượng video tính bằng giây (4–15). Mặc định 5 |
| generate_audio | No | Tạo bản âm thanh. Mặc định false |
| image_urls | No | Hình ảnh khung hình đầu (tối đa 1, tối đa 10 MB) cho chuyển hình ảnh thành video |
Seedance 2.0 phản hồi tốt với chỉ dẫn điện ảnh. Các cụm từ như "slow dolly forward," "overhead tracking shot," hoặc "quick cut to close-up" giúp cải thiện tính mạch lạc.
Khi generate_audio được bật, mô hình suy luận âm thanh từ mô tả cảnh. Viết prompt gợi ý âm thanh — "rain hitting a window," "footsteps on gravel" — thay vì mô tả âm thanh trực tiếp.
Clip ngắn (4–5s) phù hợp nhất cho cảnh đơn hành động. Cho chuỗi có chuyển cảnh hoặc nhịp tường thuật, tăng lên 10–15 giây.
Có. Đặt generate_audio thành true và mô hình sẽ tạo hội thoại đồng bộ, hiệu ứng âm thanh và âm thanh nền trong một lần xử lý. Điều này làm tăng chi phí mỗi lượt chạy.
15 giây. Bạn có thể đặt bất kỳ số nguyên nào từ 4 đến 15 qua tham số duration. Mặc định là 5 giây.
Có. Tải lên hình ảnh khung hình đầu qua image_urls và mô hình sẽ tạo video bắt đầu từ khung hình đó.