Veo 3.1 Fast - Runbase

Вход

РезультатПоказать все

Результат появится здесь

Цены

720p

$0.33

1080p

$0.36

Примеры

Кинематографическое поле боя

16:9

First-person view soaring low over a medieval battlefield at dawn, gliding past clashing knights in armor, fire-lit arrows whizzing overhead, splintered catapults burning near fallen soldiers, flying inches above torn flags and mud-soaked ground, raw, terrifying, epic

Обзор

Veo 3.1 Fast — ускоренный и экономичный вариант видеомодели Veo 3.1 от Google DeepMind. Как и остальные модели семейства Veo 3, она генерирует звук нативно — синхронизированные диалоги, звуковые эффекты и фоновое аудио создаются вместе с визуалом за один проход. Модель генерирует видео с разрешением до 1080p в двух соотношениях сторон (16:9 и 9:16) и принимает до двух кадровых изображений для image-to-video, обеспечивая управление первым и последним кадром.

Сценарии использования

Кинематографический контент, где звук неотделим от визуала — природные документальные фильмы с фоновым аудио, презентации продуктов со звуковыми эффектами. Reels и вертикальное видео для социальных сетей со встроенным звуковым дизайном. Image-to-video с начальным и конечным кадрами для управляемых анимационных дуг. Диалоговые сцены и нарративные клипы с синхронизированной речью.

Входные параметры

Все параметры передаются в объекте input запроса на выполнение.

Parameter	Required	Description
prompt	Yes	Текстовое описание (1–5000 символов)
aspect_ratio	No	По умолчанию `16:9`. Варианты: `16:9`, `9:16`
resolution	No	По умолчанию `720p`. Варианты: `720p`, `1080p`
image_urls	No	До 2 кадровых изображений (макс. 10 MB каждое) для image-to-video

Советы по промптам

Описывайте звуковой ландшафт сцены

Veo 3 генерирует звук нативно. Промпты, подразумевающие звук — «rain on a tin roof», «crowd cheering in a stadium», «whispered conversation» — дают более насыщенный и иммерсивный результат, чем чисто визуальные описания.

Используйте два изображения для управления динамикой

Загрузите изображение первого кадра и второе как конечное состояние. Veo 3 интерполирует между ними, давая вам контроль над начальной композицией и финальной позой или кадрированием.

Будьте конкретны в отношении камеры

Фразы вроде «slow tracking shot», «static wide angle» или «handheld close-up» напрямую влияют на движение камеры. Размытые промпты дают стандартное движение.

Ограничения

Только 2 соотношения сторон (16:9 и 9:16) — нет квадратного или сверхширокого вариантов
Нет параметра длительности — модель определяет длину клипа автоматически
Нет разрешения ниже 720p
Время генерации может быть дольше, чем у конкурирующих моделей
Нет переключателя generate_audio — модель не предоставляет возможности управлять выводом аудио

Часто задаваемые вопросы

Можно ли отключить генерацию звука?

Нет. Veo 3 Fast всегда генерирует звук нативно и не предоставляет переключатель generate_audio для его отключения. (Некоторые другие модели, например Seedance от ByteDance, имеют переключатель generate_audio.)

Можно ли управлять длительностью видео?

Нет. Veo 3 не предоставляет параметр длительности. Модель определяет длину клипа на основе содержания промпта. Типичная длительность — от нескольких секунд до примерно 8 секунд.

Как работают два кадровых изображения?

Первое изображение задаёт начальный кадр; второе — целевое конечное состояние. Модель генерирует видео с переходом между ними. Можно также предоставить только одно изображение, чтобы зафиксировать начальный кадр.