GPT Image 1 - Runbase

Đầu vào

Đầu raXem tất cả

Kết quả sẽ hiển thị tại đây

Bảng giá

Cố định

$0.05

Ví dụ

Cảnh quan thành phố Cyberpunk

1:1

A serene cyberpunk cityscape at twilight, with neon signs glowing in vibrant blues and purples, reflecting on rain-slick streets. Sleek futuristic buildings tower above, connected by glowing skybridges. A lone figure in a hooded jacket stands under a streetlamp, backlit by soft mist. The atmosphere is cinematic, moody

Tổng quan

GPT Image 1 là mô hình hình ảnh đa phương thức gốc đầu tiên của OpenAI, được xây dựng trên GPT-4o và ra mắt vào tháng 4 năm 2025. Khác với các mô hình hình ảnh dựa trên khuếch tán, mô hình tạo hình ảnh theo từng token — cùng phương pháp tự hồi quy được sử dụng trong mô hình ngôn ngữ GPT. Điều này mang lại khả năng tuân thủ prompt mạnh hơn và bố cục mạch lạc hơn. Mô hình trở nên viral ngay sau khi ra mắt nhờ khả năng tạo hình minh họa phong cách Ghibli.

Trường hợp sử dụng

Khám phá sáng tạo nhanh và tạo bảng tâm trạng. Hình ảnh mạng xã hội và thumbnail. Phác thảo concept sản phẩm. Chỉnh sửa hình ảnh bằng hướng dẫn ngôn ngữ tự nhiên — tải lên tới 5 hình ảnh tham chiếu để định hướng phong cách hoặc bố cục.

Đầu vào

Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.

Parameter	Required	Description
prompt	Yes	Mô tả văn bản của hình ảnh cần tạo (1–4000 ký tự)
aspect_ratio	No	Tỷ lệ khung hình đầu ra. Mặc định `1:1`. Tùy chọn: `1:1`, `3:2`, `2:3`
image_urls	No	Tối đa 5 hình ảnh tham chiếu (mỗi ảnh tối đa 4 MB) cho chỉnh sửa hình ảnh

Mẹo viết prompt

Tận dụng chỉ dẫn phong cách

GPT Image 1 rất giỏi với các phong cách nghệ thuật dễ nhận biết. Đề cập đến thẩm mỹ cụ thể — "Studio Ghibli watercolor," "vintage travel poster," "flat vector illustration" — cho kết quả đặc sắc hơn so với mô tả chung chung.

Giữ prompt tập trung

Với chỉ 3 tỷ lệ khung hình và không có điều khiển độ phân giải, bố cục đơn giản hơn thường cho kết quả tốt nhất. Mô tả chủ thể chính và tâm trạng thay vì nhồi nhét chi tiết bố cục.

Hạn chế

Chỉ có 3 tỷ lệ khung hình (1:1, 3:2, 2:3)
Không có điều khiển độ phân giải — độ phân giải đầu ra do mô hình quyết định
Văn bản phức tạp hoặc nhỏ trong hình ảnh có thể cần lặp để đạt độ chính xác
Giới hạn prompt 4000 ký tự
Tối đa 5 hình ảnh tham chiếu mỗi yêu cầu, mỗi ảnh 4 MB

Câu hỏi thường gặp

GPT Image 1 khác gì so với DALL-E?

GPT Image 1 sử dụng kiến trúc tự hồi quy (tạo theo từng token) thay vì khuếch tán. Điều này thường mang lại khả năng tuân thủ prompt tốt hơn và bố cục mạch lạc hơn.

Có những tỷ lệ khung hình nào?

Ba tùy chọn: 1:1, 3:2, và 2:3. Mặc định là 1:1.

Tôi có thể chỉnh sửa hình ảnh có sẵn không?

Có. Tải lên tới 5 hình ảnh tham chiếu qua image_urls để hướng dẫn quá trình tạo bằng hình ảnh của bạn.