Обзор
GPT Image 2 — флагманская модель OpenAI для генерации изображений, выпущенная в апреле 2026 года. Это одна из первых моделей со встроенным рассуждением — модель планирует композицию и проверяет ограничения промпта перед генерацией. Поддерживает многоязычный рендеринг текста, включая CJK, хинди и бенгали, что делает её подходящей для глобальной творческой работы.
Сценарии использования
Продуктовая фотография с точным освещением и материалами. Рекламные и редакционные визуалы, где важны фотореализм и мелкие детали. Инфографика, макеты UI и дизайн постеров с читаемым встроенным текстом. Редактирование по референсам — загрузите до 4 изображений для управления стилем, цветовой палитрой или композицией.
Входные параметры
Все параметры передаются в объекте input запроса на выполнение.
| Parameter | Required | Description |
|---|
| prompt | Yes | Текстовое описание генерируемого изображения (1–4000 символов) |
| aspect_ratio | No | Соотношение сторон. По умолчанию 1:1. Варианты: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| resolution | No | Разрешение вывода. По умолчанию 1K. Варианты: 1K, 2K, 4K (4K только при 16:9, 9:16 или 21:9) |
| image_urls | No | До 4 референсных изображений (макс. 4 MB каждое) для генерации image-to-image |
Советы по промптам
Явно описывайте материалы и освещение
GPT Image 2 хорошо реагирует на физические описания. «Matte ceramic vase on a walnut table, soft window light from the left» стабильно даёт лучший результат, чем «a vase on a table».
Сочетайте 4K с широкоформатными соотношениями
Вывод в 4K ограничен соотношениями 16:9, 9:16 и 21:9. Для максимальной детализации в горизонтальных или сверхшироких композициях комбинируйте resolution: "4K" с одним из этих соотношений.
Используйте референсные изображения для стилистической последовательности
Предоставляйте референсные изображения, максимально близкие к целевому стилю — модель использует их для определения цветовой палитры и композиции, а не экстраполирует из далёких референсов.
Ограничения
- Мелкий текст на изображениях может потребовать итераций для точности
- Сложные руки, логотипы и точные ограничения компоновки следует проверять вручную
- Разрешение 4K доступно только при соотношениях 16:9, 9:16 или 21:9
- Максимум 4 референсных изображения на запрос, 4 MB каждое
- Длина промпта ограничена 4000 символами
Часто задаваемые вопросы
Какие соотношения сторон поддерживает GPT Image 2?
Десять вариантов: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9 и 21:9. По умолчанию 1:1.
Поддерживает ли GPT Image 2 вывод в 4K?
Да — доступны 1K, 2K и 4K. Режим 4K ограничен соотношениями 16:9, 9:16 и 21:9.
Можно ли редактировать существующие изображения?
Да. Загрузите до 4 референсных изображений через image_urls, чтобы направить генерацию с помощью собственных визуалов.