Обзор
Veo 3.1 Fast — ускоренный и экономичный вариант видеомодели Veo 3.1 от Google DeepMind. Как и остальные модели семейства Veo 3, она генерирует звук нативно — синхронизированные диалоги, звуковые эффекты и фоновое аудио создаются вместе с визуалом за один проход. Модель генерирует видео с разрешением до 1080p в двух соотношениях сторон (16:9 и 9:16) и принимает до двух кадровых изображений для image-to-video, обеспечивая управление первым и последним кадром.
Сценарии использования
Кинематографический контент, где звук неотделим от визуала — природные документальные фильмы с фоновым аудио, презентации продуктов со звуковыми эффектами. Reels и вертикальное видео для социальных сетей со встроенным звуковым дизайном. Image-to-video с начальным и конечным кадрами для управляемых анимационных дуг. Диалоговые сцены и нарративные клипы с синхронизированной речью.
Входные параметры
Все параметры передаются в объекте input запроса на выполнение.
| Parameter | Required | Description |
|---|
| prompt | Yes | Текстовое описание (1–5000 символов) |
| aspect_ratio | No | По умолчанию 16:9. Варианты: 16:9, 9:16 |
| resolution | No | По умолчанию 720p. Варианты: 720p, 1080p |
| image_urls | No | До 2 кадровых изображений (макс. 10 MB каждое) для image-to-video |
Советы по промптам
Описывайте звуковой ландшафт сцены
Veo 3 генерирует звук нативно. Промпты, подразумевающие звук — «rain on a tin roof», «crowd cheering in a stadium», «whispered conversation» — дают более насыщенный и иммерсивный результат, чем чисто визуальные описания.
Используйте два изображения для управления динамикой
Загрузите изображение первого кадра и второе как конечное состояние. Veo 3 интерполирует между ними, давая вам контроль над начальной композицией и финальной позой или кадрированием.
Будьте конкретны в отношении камеры
Фразы вроде «slow tracking shot», «static wide angle» или «handheld close-up» напрямую влияют на движение камеры. Размытые промпты дают стандартное движение.
Ограничения
- Только 2 соотношения сторон (16:9 и 9:16) — нет квадратного или сверхширокого вариантов
- Нет параметра длительности — модель определяет длину клипа автоматически
- Нет разрешения ниже 720p
- Время генерации может быть дольше, чем у конкурирующих моделей
- Нет переключателя
generate_audio — модель не предоставляет возможности управлять выводом аудио
Часто задаваемые вопросы
Можно ли отключить генерацию звука?
Нет. Veo 3 Fast всегда генерирует звук нативно и не предоставляет переключатель generate_audio для его отключения. (Некоторые другие модели, например Seedance от ByteDance, имеют переключатель generate_audio.)
Можно ли управлять длительностью видео?
Нет. Veo 3 не предоставляет параметр длительности. Модель определяет длину клипа на основе содержания промпта. Типичная длительность — от нескольких секунд до примерно 8 секунд.
Как работают два кадровых изображения?
Первое изображение задаёт начальный кадр; второе — целевое конечное состояние. Модель генерирует видео с переходом между ними. Можно также предоставить только одно изображение, чтобы зафиксировать начальный кадр.