
Cảnh hội thoại
16:9A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech
bytedance/seedance-1.5-proAPI tạo video Seedance 1.5 Pro của ByteDance — video chất lượng điện ảnh với âm thanh đồng bộ, hội thoại đa ngôn ngữ, và độ phân giải lên đến 1080p.
curl https://api.runbase.net/v1/runs \
-H "Authorization: Bearer $RUNBASE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance/seedance-1.5-pro",
"input": {
"prompt": "A cinematic product photo of a ceramic lamp",
"aspect_ratio": "1:1",
"resolution": "1K"
}
}'
A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech

Extreme close-up of an older person's face by a window, a single tear forming, soft natural light

The tear rolls slowly down the cheek, subtle facial movement, ambient room tone
Seedance 1.5 Pro là mô hình video đầu tiên của ByteDance có tính năng tạo âm thanh tích hợp, cầu nối giữa dòng 1.0 không có tiếng và bản phát hành 2.0 đầy đủ tính năng. Mô hình tạo video chất lượng điện ảnh ở độ phân giải lên đến 1080p với hội thoại đồng bộ, hiệu ứng âm thanh và âm thanh nền bằng nhiều ngôn ngữ. Mô hình chấp nhận tối đa hai hình ảnh tham chiếu cho chuyển hình ảnh thành video, cho phép kiểm soát khung hình đầu và khung hình cuối. Thời lượng cố định ở 4, 8 hoặc 12 giây.
Cảnh có hội thoại — phỏng vấn, độc thoại, video giải thích với lời nói đồng bộ. Quảng cáo sáng tạo đa ngôn ngữ khi lời bình cần khớp với hình ảnh. Chuyển hình ảnh thành video với hai khung hình tham chiếu để kiểm soát cả đầu và cuối clip. Nội dung tường thuật ngắn với thiết kế âm thanh nền.
Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | Mô tả văn bản (3–2500 ký tự) |
| aspect_ratio | No | Mặc định 16:9. Tùy chọn: 16:9, 9:16, 4:3, 3:4, 1:1, 21:9 |
| resolution | No | Mặc định 720p. Tùy chọn: 480p, 720p, 1080p |
| duration | No | Mặc định 4. Tùy chọn: 4s, 8s, 12s |
| generate_audio | No | Tạo âm thanh đồng bộ. Mặc định false |
| image_urls | No | Tối đa 2 hình ảnh tham chiếu (mỗi ảnh tối đa 10 MB) cho chuyển hình ảnh thành video |
Thay vì trích dẫn lời thoại ("He says: Hello"), hãy mô tả tình huống: "A man greets someone warmly at a doorstep, casual tone." Mô hình sẽ suy luận hội thoại phù hợp từ ngữ cảnh.
Tải lên hình ảnh khung hình đầu tiên và hình ảnh thứ hai làm trạng thái kết thúc mong muốn. Mô hình sẽ nội suy chuyển động giữa chúng, giúp bạn kiểm soát chặt hơn diễn biến của clip.
Mô hình tạo hội thoại và lời bình đa ngôn ngữ. Ngôn ngữ được suy luận từ ngữ cảnh prompt — viết mô tả cảnh bằng ngôn ngữ mục tiêu hoặc chỉ định ngôn ngữ rõ ràng.
Seedance 2.0 hỗ trợ thời lượng tùy ý từ 4 đến 15 giây, giới hạn prompt 20000 ký tự và chất lượng hình ảnh cao hơn nhìn chung. 1.5 Pro bị giới hạn ở thời lượng cố định 4/8/12s và 2500 ký tự. Trên Runbase, 1.5 Pro chấp nhận tối đa hai hình ảnh tham chiếu (khung hình đầu và cuối), trong khi 2.0 chỉ nhận một hình ảnh khung hình đầu.
Có. Tham số generate_audio mặc định là false. Để nguyên để nhận đầu ra video không có tiếng, giống như các mô hình 1.0.