Runbase

개요

Seedance 1.5 Pro는 ByteDance 최초의 네이티브 오디오 생성 영상 모델로, 무음 1.0 시리즈와 본격적인 2.0 사이의 다리 역할을 합니다. 최대 1080p의 시네마 수준 영상과 함께 다국어 동기화 대사, 사운드 이펙트, 앰비언트 오디오를 생성합니다. 이미지-투-비디오에서 최대 2장의 참조 이미지를 받아 첫 프레임과 마지막 프레임을 제어할 수 있습니다. 길이는 4초, 8초, 12초 중 선택할 수 있습니다.

사용 사례

대사 중심 장면 — 인터뷰, 독백, 동기화 음성이 포함된 설명 영상. 보이스오버와 영상이 일치해야 하는 다국어 광고 소재. 클립의 시작과 끝을 제어하기 위한 2장 참조 이미지 기반 이미지-투-비디오. 앰비언트 사운드 디자인이 포함된 짧은 내러티브 콘텐츠.

입력

모든 파라미터는 실행 요청의 input 객체에 전달됩니다.

Parameter	Required	Description
prompt	Yes	텍스트 설명 (3–2500자)
aspect_ratio	No	기본값 `16:9`. 옵션: `16:9`, `9:16`, `4:3`, `3:4`, `1:1`, `21:9`
resolution	No	기본값 `720p`. 옵션: `480p`, `720p`, `1080p`
duration	No	기본값 `4`. 옵션: `4s`, `8s`, `12s`
generate_audio	No	동기화 오디오 생성. 기본값 `false`
image_urls	No	이미지-투-비디오용 참조 이미지 최대 2장 (각 최대 10 MB)

프롬프트 팁

대사는 대본이 아닌 장면 연출로 작성하세요

직접 인용("그가 말한다: 안녕하세요") 대신 상황을 묘사하세요: "한 남성이 현관에서 누군가를 따뜻하게 맞이하며 캐주얼한 어조로 인사한다." 모델이 맥락에서 적절한 대사를 추론합니다.

2장 이미지 슬롯을 시작/끝 프레이밍에 활용하세요

첫 프레임 이미지와 목표 최종 상태 이미지를 함께 업로드하세요. 모델이 두 이미지 사이의 모션을 보간하여 클립의 흐름을 더 세밀하게 제어할 수 있습니다.

제한 사항

Seedance 2.0의 20000자 대비 짧은 프롬프트 제한 (2500자)
3가지 고정 길이 옵션만 제공 (4초, 8초, 12초) — 임의 길이 불가
프롬프트 최소 3자
오디오 생성 시 실행당 비용 증가
1080p는 720p 대비 생성 시간과 비용 대폭 증가

자주 묻는 질문

오디오는 어떤 언어를 지원하나요?

다국어 대사와 보이스오버를 생성합니다. 언어는 프롬프트 맥락에서 자동 추론됩니다 — 목표 언어로 장면 설명을 작성하거나 언어를 명시적으로 지정하세요.

1.5 Pro와 2.0의 차이점은?

Seedance 2.0은 4~15초의 임의 길이, 20000자 프롬프트 제한, 전반적으로 더 높은 시각적 품질을 지원합니다. 1.5 Pro는 고정 4/8/12초 길이와 2500자 제한입니다. Runbase에서 1.5 Pro는 최대 2장의 참조 이미지 (첫 프레임과 마지막 프레임)를 받고, 2.0은 단일 첫 프레임 이미지만 받습니다.

오디오를 비활성화하고 영상만 받을 수 있나요?

예. generate_audio 파라미터의 기본값은 false입니다. 설정하지 않으면 1.0 모델과 동일하게 무음 영상이 출력됩니다.

Seedance 1.5 Pro

예시

대사 장면

이미지-투-비디오 (원본)

이미지-투-비디오 (결과)

개요