Runbase

Command Palette

Search for a command to run...

Google

Veo 3.1 Fast

ID:google/veo-3

Veo 3.1 Fast — быстрая и экономичная видеомодель от Google DeepMind со встроенным звуком (диалоги и эффекты), image-to-video и разрешением до 1080p.

Текст в видеоИзображение в видеоГенерация звука1080p
Вход
Aspect ratio
Resolution
Frame images
Максимум 2 изображений, 10 МБ каждое
РезультатПоказать все
Результат появится здесь
720p
$0.33
1080p
$0.36
cURL
curl https://api.runbase.net/v1/runs \
  -H "Authorization: Bearer $RUNBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/veo-3",
    "input": {
      "prompt": "A cinematic product photo of a ceramic lamp",
      "aspect_ratio": "1:1",
      "resolution": "1K"
    }
  }'

Примеры

Кинематографическое поле боя

Кинематографическое поле боя

16:9

First-person view soaring low over a medieval battlefield at dawn, gliding past clashing knights in armor, fire-lit arrows whizzing overhead, splintered catapults burning near fallen soldiers, flying inches above torn flags and mud-soaked ground, raw, terrifying, epic

Обзор

Veo 3.1 Fast — ускоренный и экономичный вариант видеомодели Veo 3.1 от Google DeepMind. Как и остальные модели семейства Veo 3, она генерирует звук нативно — синхронизированные диалоги, звуковые эффекты и фоновое аудио создаются вместе с визуалом за один проход. Модель генерирует видео с разрешением до 1080p в двух соотношениях сторон (16:9 и 9:16) и принимает до двух кадровых изображений для image-to-video, обеспечивая управление первым и последним кадром.

Сценарии использования

Кинематографический контент, где звук неотделим от визуала — природные документальные фильмы с фоновым аудио, презентации продуктов со звуковыми эффектами. Reels и вертикальное видео для социальных сетей со встроенным звуковым дизайном. Image-to-video с начальным и конечным кадрами для управляемых анимационных дуг. Диалоговые сцены и нарративные клипы с синхронизированной речью.

Входные параметры

Все параметры передаются в объекте input запроса на выполнение.

ParameterRequiredDescription
promptYesТекстовое описание (1–5000 символов)
aspect_ratioNoПо умолчанию 16:9. Варианты: 16:9, 9:16
resolutionNoПо умолчанию 720p. Варианты: 720p, 1080p
image_urlsNoДо 2 кадровых изображений (макс. 10 MB каждое) для image-to-video

Советы по промптам

Описывайте звуковой ландшафт сцены

Veo 3 генерирует звук нативно. Промпты, подразумевающие звук — «rain on a tin roof», «crowd cheering in a stadium», «whispered conversation» — дают более насыщенный и иммерсивный результат, чем чисто визуальные описания.

Используйте два изображения для управления динамикой

Загрузите изображение первого кадра и второе как конечное состояние. Veo 3 интерполирует между ними, давая вам контроль над начальной композицией и финальной позой или кадрированием.

Будьте конкретны в отношении камеры

Фразы вроде «slow tracking shot», «static wide angle» или «handheld close-up» напрямую влияют на движение камеры. Размытые промпты дают стандартное движение.

Ограничения

  • Только 2 соотношения сторон (16:9 и 9:16) — нет квадратного или сверхширокого вариантов
  • Нет параметра длительности — модель определяет длину клипа автоматически
  • Нет разрешения ниже 720p
  • Время генерации может быть дольше, чем у конкурирующих моделей
  • Нет переключателя generate_audio — модель не предоставляет возможности управлять выводом аудио

Часто задаваемые вопросы

Можно ли отключить генерацию звука?

Нет. Veo 3 Fast всегда генерирует звук нативно и не предоставляет переключатель generate_audio для его отключения. (Некоторые другие модели, например Seedance от ByteDance, имеют переключатель generate_audio.)

Можно ли управлять длительностью видео?

Нет. Veo 3 не предоставляет параметр длительности. Модель определяет длину клипа на основе содержания промпта. Типичная длительность — от нескольких секунд до примерно 8 секунд.

Как работают два кадровых изображения?

Первое изображение задаёт начальный кадр; второе — целевое конечное состояние. Модель генерирует видео с переходом между ними. Можно также предоставить только одно изображение, чтобы зафиксировать начальный кадр.