Tổng quan
GPT Image 2 là mô hình tạo hình ảnh hàng đầu của OpenAI, ra mắt vào tháng 4 năm 2026. Đây là một trong những mô hình hình ảnh đầu tiên có khả năng suy luận tích hợp — mô hình lên kế hoạch bố cục và xác minh các ràng buộc của prompt trước khi tạo. Mô hình hỗ trợ hiển thị văn bản đa ngôn ngữ trên nhiều hệ chữ bao gồm CJK, Hindi và Bengali, phù hợp cho công việc sáng tạo toàn cầu.
Trường hợp sử dụng
Chụp ảnh sản phẩm với ánh sáng và vật liệu chính xác. Hình ảnh chiến dịch và biên tập khi chủ nghĩa hiện thực và chi tiết tinh tế quan trọng. Infographic, mockup UI và thiết kế poster yêu cầu văn bản nhúng dễ đọc. Chỉnh sửa theo hình ảnh tham chiếu — tải lên tới 4 hình ảnh để định hướng phong cách, bảng màu hoặc bố cục.
Đầu vào
Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.
| Parameter | Required | Description |
|---|
| prompt | Yes | Mô tả văn bản của hình ảnh cần tạo (1–4000 ký tự) |
| aspect_ratio | No | Tỷ lệ khung hình đầu ra. Mặc định 1:1. Tùy chọn: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| resolution | No | Độ phân giải đầu ra. Mặc định 1K. Tùy chọn: 1K, 2K, 4K (4K chỉ với 16:9, 9:16, hoặc 21:9) |
| image_urls | No | Tối đa 4 hình ảnh tham chiếu (mỗi ảnh tối đa 4 MB) cho tạo hình ảnh từ hình ảnh |
Mẹo viết prompt
Mô tả vật liệu và ánh sáng rõ ràng
GPT Image 2 phản hồi tốt với mô tả vật lý. "Matte ceramic vase on a walnut table, soft window light from the left" luôn cho kết quả tốt hơn "a vase on a table."
Kết hợp 4K với tỷ lệ màn hình rộng
Đầu ra 4K bị giới hạn ở 16:9, 9:16, và 21:9. Để có chi tiết tối đa trong bố cục ngang hoặc siêu rộng, kết hợp resolution: "4K" với một trong các tỷ lệ này.
Dùng hình ảnh tham chiếu cho nhất quán phong cách
Cung cấp hình ảnh tham chiếu khớp với phong cách mục tiêu — mô hình sử dụng chúng để hướng dẫn bảng màu và bố cục thay vì suy luận từ tham chiếu xa.
Hạn chế
- Văn bản nhỏ trong hình ảnh có thể cần lặp để đạt độ chính xác
- Bàn tay phức tạp, logo và ràng buộc bố cục chính xác nên được kiểm tra thủ công
- Độ phân giải 4K chỉ khả dụng với tỷ lệ khung hình 16:9, 9:16, hoặc 21:9
- Tối đa 4 hình ảnh tham chiếu mỗi yêu cầu, mỗi ảnh 4 MB
- Giới hạn prompt 4000 ký tự
Câu hỏi thường gặp
GPT Image 2 hỗ trợ những tỷ lệ khung hình nào?
Mười tùy chọn: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, và 21:9. Mặc định là 1:1.
GPT Image 2 có hỗ trợ 4K không?
Có — 1K, 2K, và 4K khả dụng. 4K bị giới hạn ở tỷ lệ 16:9, 9:16, và 21:9.
Tôi có thể chỉnh sửa hình ảnh có sẵn không?
Có. Tải lên tới 4 hình ảnh tham chiếu qua image_urls để hướng dẫn quá trình tạo bằng hình ảnh của bạn.