
대사 장면
16:9A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech
bytedance/seedance-1.5-proByteDance의 Seedance 1.5 Pro 영상 생성 API — 동기화된 오디오, 다국어 대사, 최대 1080p를 지원하는 시네마 수준 영상 모델.
curl https://api.runbase.net/v1/runs \
-H "Authorization: Bearer $RUNBASE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance/seedance-1.5-pro",
"input": {
"prompt": "A cinematic product photo of a ceramic lamp",
"aspect_ratio": "1:1",
"resolution": "1K"
}
}'
A lawyer delivering a closing argument from the lectern of a wood-paneled courtroom, jury seated behind, synchronized speech

Extreme close-up of an older person's face by a window, a single tear forming, soft natural light

The tear rolls slowly down the cheek, subtle facial movement, ambient room tone
Seedance 1.5 Pro는 ByteDance 최초의 네이티브 오디오 생성 영상 모델로, 무음 1.0 시리즈와 본격적인 2.0 사이의 다리 역할을 합니다. 최대 1080p의 시네마 수준 영상과 함께 다국어 동기화 대사, 사운드 이펙트, 앰비언트 오디오를 생성합니다. 이미지-투-비디오에서 최대 2장의 참조 이미지를 받아 첫 프레임과 마지막 프레임을 제어할 수 있습니다. 길이는 4초, 8초, 12초 중 선택할 수 있습니다.
대사 중심 장면 — 인터뷰, 독백, 동기화 음성이 포함된 설명 영상. 보이스오버와 영상이 일치해야 하는 다국어 광고 소재. 클립의 시작과 끝을 제어하기 위한 2장 참조 이미지 기반 이미지-투-비디오. 앰비언트 사운드 디자인이 포함된 짧은 내러티브 콘텐츠.
모든 파라미터는 실행 요청의 input 객체에 전달됩니다.
| Parameter | Required | Description |
|---|---|---|
| prompt | Yes | 텍스트 설명 (3–2500자) |
| aspect_ratio | No | 기본값 16:9. 옵션: 16:9, 9:16, 4:3, 3:4, 1:1, 21:9 |
| resolution | No | 기본값 720p. 옵션: 480p, 720p, 1080p |
| duration | No | 기본값 4. 옵션: 4s, 8s, 12s |
| generate_audio | No | 동기화 오디오 생성. 기본값 false |
| image_urls | No | 이미지-투-비디오용 참조 이미지 최대 2장 (각 최대 10 MB) |
직접 인용("그가 말한다: 안녕하세요") 대신 상황을 묘사하세요: "한 남성이 현관에서 누군가를 따뜻하게 맞이하며 캐주얼한 어조로 인사한다." 모델이 맥락에서 적절한 대사를 추론합니다.
첫 프레임 이미지와 목표 최종 상태 이미지를 함께 업로드하세요. 모델이 두 이미지 사이의 모션을 보간하여 클립의 흐름을 더 세밀하게 제어할 수 있습니다.
다국어 대사와 보이스오버를 생성합니다. 언어는 프롬프트 맥락에서 자동 추론됩니다 — 목표 언어로 장면 설명을 작성하거나 언어를 명시적으로 지정하세요.
Seedance 2.0은 4~15초의 임의 길이, 20000자 프롬프트 제한, 전반적으로 더 높은 시각적 품질을 지원합니다. 1.5 Pro는 고정 4/8/12초 길이와 2500자 제한입니다. Runbase에서 1.5 Pro는 최대 2장의 참조 이미지 (첫 프레임과 마지막 프레임)를 받고, 2.0은 단일 첫 프레임 이미지만 받습니다.
예. generate_audio 파라미터의 기본값은 false입니다. 설정하지 않으면 1.0 모델과 동일하게 무음 영상이 출력됩니다.