Runbase

Command Palette

Search for a command to run...

OpenAI

GPT Image 1

ID:openai/gpt-image-1

OpenAI 推出的 GPT Image 1 图片生成 API —— OpenAI 首个 GPT-4o 原生图片模型,提示词遵循度强,支持最多 5 张参考图。

文生图图片编辑参考图
输入
Aspect ratio
Reference images
最多 5 张图片,每张不超过 4MB
输出将显示在此处
固定
$0.05
cURL
curl https://api.runbase.net/v1/runs \
  -H "Authorization: Bearer $RUNBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-image-1",
    "input": {
      "prompt": "一张陶瓷台灯的电影级产品照片",
      "aspect_ratio": "1:1",
      "resolution": "1K"
    }
  }'

示例

赛博朋克城市

赛博朋克城市

1:1

A serene cyberpunk cityscape at twilight, with neon signs glowing in vibrant blues and purples, reflecting on rain-slick streets. Sleek futuristic buildings tower above, connected by glowing skybridges. A lone figure in a hooded jacket stands under a streetlamp, backlit by soft mist. The atmosphere is cinematic, moody

概述

GPT Image 1 是 OpenAI 首个原生多模态图片模型,基于 GPT-4o 构建,于 2025 年 4 月发布。与基于扩散的图片模型不同,它逐 token 生成图片——与 GPT 语言模型相同的自回归方式。这使它具有更强的提示词遵循度和更连贯的构图。发布后不久因出色的吉卜力风格插画能力而迅速走红。

使用场景

快速创意探索和情绪板制作。社交媒体视觉素材和缩略图。产品概念草图。通过自然语言指令进行图片编辑——上传最多 5 张参考图来引导风格或构图。

输入参数

所有参数通过运行请求的 input 对象传入。

ParameterRequiredDescription
promptYes图片生成的文本描述(1–4000 字符)
aspect_ratioNo输出画面比例。默认 1:1。可选:1:13:22:3
image_urlsNo最多 5 张参考图(每张最大 4 MB)用于图片编辑

提示词技巧

善用风格指引

GPT Image 1 擅长呈现辨识度高的艺术风格。提及具体的美学方向——"Studio Ghibli watercolor"、"vintage travel poster"、"flat vector illustration"——比泛泛的描述更能产出有特色的结果。

保持提示词聚焦

只有 3 种画面比例且没有分辨率控制,较简洁的构图往往效果最好。描述核心主体和氛围,而不是堆砌布局细节。

限制

  • 仅 3 种画面比例可用(1:1、3:2、2:3)
  • 没有分辨率控制——输出分辨率由模型固定
  • 图片中的复杂或小号文字可能需要多次迭代才能准确
  • 提示词上限 4000 字符
  • 每次请求最多 5 张参考图,每张 4 MB

常见问题

GPT Image 1 和 DALL-E 有什么区别?

GPT Image 1 使用自回归架构(逐 token 生成)而非扩散模型。这通常能产出更好的提示词遵循度和更连贯的构图。

有哪些画面比例可选?

三种:1:1、3:2 和 2:3。默认为 1:1。

可以编辑已有图片吗?

可以。通过 image_urls 上传最多 5 张参考图来引导生成。