Übersicht
GPT Image 2 ist OpenAIs Flaggschiff-Modell zur Bilderzeugung, veröffentlicht im April 2026. Es ist eines der ersten Bildmodelle mit integriertem Reasoning — das Modell plant die Komposition und überprüft Prompt-Vorgaben vor der Generierung. Es unterstützt mehrsprachiges Textrendering über Schriftsysteme hinweg, einschließlich CJK, Hindi und Bengali, und eignet sich damit gut für globale kreative Arbeit.
Anwendungsfälle
Produktfotografie mit akkurater Beleuchtung und Materialdarstellung. Kampagnen- und Redaktionsbilder, bei denen Fotorealismus und feine Details zählen. Infografiken, UI-Mockups und Poster-Designs mit lesbarem eingebettetem Text. Referenzgesteuerte Bearbeitung — laden Sie bis zu 4 Bilder hoch, um Stil, Farbpalette oder Komposition zu steuern.
Eingaben
Alle Parameter werden im input-Objekt des Run-Requests übergeben.
| Parameter | Required | Description |
|---|
| prompt | Yes | Textbeschreibung des zu erzeugenden Bildes (1–4000 Zeichen) |
| aspect_ratio | No | Seitenverhältnis der Ausgabe. Standard 1:1. Optionen: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| resolution | No | Ausgabeauflösung. Standard 1K. Optionen: 1K, 2K, 4K (4K nur mit 16:9, 9:16 oder 21:9) |
| image_urls | No | Bis zu 4 Referenzbilder (max. 4 MB pro Bild) für Bild-zu-Bild-Generierung |
Prompt-Tipps
Materialien und Beleuchtung explizit beschreiben
GPT Image 2 reagiert gut auf physische Beschreibungen. „Matte ceramic vase on a walnut table, soft window light from the left" liefert konsistent bessere Ergebnisse als „a vase on a table."
4K mit Breitformat-Verhältnissen kombinieren
4K-Ausgabe ist auf 16:9, 9:16 und 21:9 beschränkt. Für maximale Details bei Quer- oder Ultra-Breitformat-Kompositionen kombinieren Sie resolution: "4K" mit einem dieser Verhältnisse.
Referenzbilder für Stilkonsistenz verwenden
Stellen Sie Referenzbilder bereit, die Ihrem Zielstil nahekommen — das Modell nutzt sie zur Steuerung von Farbpalette und Komposition, statt aus entfernten Referenzen zu extrapolieren.
Einschränkungen
- Kleiner Text in Bildern erfordert möglicherweise Iteration für Genauigkeit
- Komplexe Hände, Logos und präzise Layout-Vorgaben sollten manuell überprüft werden
- 4K-Auflösung nur mit 16:9, 9:16 oder 21:9 Seitenverhältnissen verfügbar
- Maximal 4 Referenzbilder pro Anfrage, je 4 MB
- Prompt-Länge auf 4000 Zeichen begrenzt
Häufige Fragen
Welche Seitenverhältnisse unterstützt GPT Image 2?
Zehn Optionen: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9 und 21:9. Der Standard ist 1:1.
Unterstützt GPT Image 2 4K?
Ja — 1K, 2K und 4K sind verfügbar. 4K ist auf die Verhältnisse 16:9, 9:16 und 21:9 beschränkt.
Kann ich bestehende Bilder bearbeiten?
Ja. Laden Sie bis zu 4 Referenzbilder über image_urls hoch, um die Generierung mit eigenen Bildern zu steuern.