Runbase

Command Palette

Search for a command to run...

OpenAI

GPT Image 1

ID:openai/gpt-image-1

GPT Image 1 Bilderzeugung-API von OpenAI — OpenAIs erstes GPT-4o-natives Bildmodell mit starker Prompt-Treue und bis zu 5 Referenzbildern.

Text zu BildBildbearbeitungReferenzbilder
Eingabe
Aspect ratio
Reference images
Max. 5 Bilder, je 4 MB
Ausgabe erscheint hier
Fest
$0.05
cURL
curl https://api.runbase.net/v1/runs \
  -H "Authorization: Bearer $RUNBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-image-1",
    "input": {
      "prompt": "A cinematic product photo of a ceramic lamp",
      "aspect_ratio": "1:1",
      "resolution": "1K"
    }
  }'

Beispiele

Cyberpunk-Stadtlandschaft

Cyberpunk-Stadtlandschaft

1:1

A serene cyberpunk cityscape at twilight, with neon signs glowing in vibrant blues and purples, reflecting on rain-slick streets. Sleek futuristic buildings tower above, connected by glowing skybridges. A lone figure in a hooded jacket stands under a streetlamp, backlit by soft mist. The atmosphere is cinematic, moody

Übersicht

GPT Image 1 ist OpenAIs erstes nativ multimodales Bildmodell, basierend auf GPT-4o und veröffentlicht im April 2025. Anders als diffusionsbasierte Bildmodelle erzeugt es Bilder Token für Token — derselbe autoregressive Ansatz, der in GPT-Sprachmodellen verwendet wird. Das sorgt für stärkere Prompt-Treue und kohärentere Kompositionen. Kurz nach dem Launch ging es viral durch seine Fähigkeit, Illustrationen im Ghibli-Stil zu erzeugen.

Anwendungsfälle

Schnelle kreative Exploration und Moodboarding. Social-Media-Bilder und Thumbnails. Produkt-Konzeptskizzen. Bildbearbeitung mit natürlichsprachlichen Anweisungen — laden Sie bis zu 5 Referenzbilder hoch, um Stil oder Komposition zu steuern.

Eingaben

Alle Parameter werden im input-Objekt des Run-Requests übergeben.

ParameterRequiredDescription
promptYesTextbeschreibung des zu erzeugenden Bildes (1–4000 Zeichen)
aspect_ratioNoSeitenverhältnis der Ausgabe. Standard 1:1. Optionen: 1:1, 3:2, 2:3
image_urlsNoBis zu 5 Referenzbilder (max. 4 MB pro Bild) zur Bildbearbeitung

Prompt-Tipps

Stilistische Richtungen nutzen

GPT Image 1 zeichnet sich bei erkennbaren Kunststilen aus. Die Erwähnung einer spezifischen Ästhetik — „Studio Ghibli watercolor", „vintage travel poster", „flat vector illustration" — liefert markantere Ergebnisse als generische Beschreibungen.

Prompts fokussiert halten

Mit nur 3 Seitenverhältnissen und ohne Auflösungssteuerung funktionieren einfachere Kompositionen tendenziell am besten. Beschreiben Sie das Kernmotiv und die Stimmung, statt Layout-Details hineinzupacken.

Einschränkungen

  • Nur 3 Seitenverhältnisse verfügbar (1:1, 3:2, 2:3)
  • Keine Auflösungssteuerung — die Ausgabeauflösung wird vom Modell festgelegt
  • Komplexer oder kleiner Text in Bildern erfordert möglicherweise Iteration für Genauigkeit
  • Prompt-Länge auf 4000 Zeichen begrenzt
  • Maximal 5 Referenzbilder pro Anfrage, je 4 MB

Häufige Fragen

Wie unterscheidet sich GPT Image 1 von DALL-E?

GPT Image 1 verwendet eine autoregressive Architektur (Token-für-Token-Generierung) anstelle von Diffusion. Dies liefert generell bessere Prompt-Treue und kohärentere Kompositionen.

Welche Seitenverhältnisse sind verfügbar?

Drei Optionen: 1:1, 3:2 und 2:3. Der Standard ist 1:1.

Kann ich bestehende Bilder bearbeiten?

Ja. Laden Sie bis zu 5 Referenzbilder über image_urls hoch, um die Generierung mit eigenen Bildern zu steuern.