Tổng quan
GPT Image 1 là mô hình hình ảnh đa phương thức gốc đầu tiên của OpenAI, được xây dựng trên GPT-4o và ra mắt vào tháng 4 năm 2025. Khác với các mô hình hình ảnh dựa trên khuếch tán, mô hình tạo hình ảnh theo từng token — cùng phương pháp tự hồi quy được sử dụng trong mô hình ngôn ngữ GPT. Điều này mang lại khả năng tuân thủ prompt mạnh hơn và bố cục mạch lạc hơn. Mô hình trở nên viral ngay sau khi ra mắt nhờ khả năng tạo hình minh họa phong cách Ghibli.
Trường hợp sử dụng
Khám phá sáng tạo nhanh và tạo bảng tâm trạng. Hình ảnh mạng xã hội và thumbnail. Phác thảo concept sản phẩm. Chỉnh sửa hình ảnh bằng hướng dẫn ngôn ngữ tự nhiên — tải lên tới 5 hình ảnh tham chiếu để định hướng phong cách hoặc bố cục.
Đầu vào
Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.
| Parameter | Required | Description |
|---|
| prompt | Yes | Mô tả văn bản của hình ảnh cần tạo (1–4000 ký tự) |
| aspect_ratio | No | Tỷ lệ khung hình đầu ra. Mặc định 1:1. Tùy chọn: 1:1, 3:2, 2:3 |
| image_urls | No | Tối đa 5 hình ảnh tham chiếu (mỗi ảnh tối đa 4 MB) cho chỉnh sửa hình ảnh |
Mẹo viết prompt
Tận dụng chỉ dẫn phong cách
GPT Image 1 rất giỏi với các phong cách nghệ thuật dễ nhận biết. Đề cập đến thẩm mỹ cụ thể — "Studio Ghibli watercolor," "vintage travel poster," "flat vector illustration" — cho kết quả đặc sắc hơn so với mô tả chung chung.
Giữ prompt tập trung
Với chỉ 3 tỷ lệ khung hình và không có điều khiển độ phân giải, bố cục đơn giản hơn thường cho kết quả tốt nhất. Mô tả chủ thể chính và tâm trạng thay vì nhồi nhét chi tiết bố cục.
Hạn chế
- Chỉ có 3 tỷ lệ khung hình (1:1, 3:2, 2:3)
- Không có điều khiển độ phân giải — độ phân giải đầu ra do mô hình quyết định
- Văn bản phức tạp hoặc nhỏ trong hình ảnh có thể cần lặp để đạt độ chính xác
- Giới hạn prompt 4000 ký tự
- Tối đa 5 hình ảnh tham chiếu mỗi yêu cầu, mỗi ảnh 4 MB
Câu hỏi thường gặp
GPT Image 1 khác gì so với DALL-E?
GPT Image 1 sử dụng kiến trúc tự hồi quy (tạo theo từng token) thay vì khuếch tán. Điều này thường mang lại khả năng tuân thủ prompt tốt hơn và bố cục mạch lạc hơn.
Có những tỷ lệ khung hình nào?
Ba tùy chọn: 1:1, 3:2, và 2:3. Mặc định là 1:1.
Tôi có thể chỉnh sửa hình ảnh có sẵn không?
Có. Tải lên tới 5 hình ảnh tham chiếu qua image_urls để hướng dẫn quá trình tạo bằng hình ảnh của bạn.