Runbase

Command Palette

Search for a command to run...

OpenAI

GPT Image 1

ID:openai/gpt-image-1

API tạo hình ảnh GPT Image 1 của OpenAI — mô hình hình ảnh GPT-4o gốc đầu tiên của OpenAI với khả năng tuân thủ prompt mạnh mẽ và tối đa 5 hình ảnh tham chiếu.

Chuyển văn bản thành hình ảnhChỉnh sửa hình ảnhHình ảnh tham chiếu
Đầu vào
Aspect ratio
Reference images
Tối đa 5 ảnh, mỗi ảnh 4MB
Kết quả sẽ hiển thị tại đây
Cố định
$0.05
cURL
curl https://api.runbase.net/v1/runs \
  -H "Authorization: Bearer $RUNBASE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-image-1",
    "input": {
      "prompt": "A cinematic product photo of a ceramic lamp",
      "aspect_ratio": "1:1",
      "resolution": "1K"
    }
  }'

Ví dụ

Cảnh quan thành phố Cyberpunk

Cảnh quan thành phố Cyberpunk

1:1

A serene cyberpunk cityscape at twilight, with neon signs glowing in vibrant blues and purples, reflecting on rain-slick streets. Sleek futuristic buildings tower above, connected by glowing skybridges. A lone figure in a hooded jacket stands under a streetlamp, backlit by soft mist. The atmosphere is cinematic, moody

Tổng quan

GPT Image 1 là mô hình hình ảnh đa phương thức gốc đầu tiên của OpenAI, được xây dựng trên GPT-4o và ra mắt vào tháng 4 năm 2025. Khác với các mô hình hình ảnh dựa trên khuếch tán, mô hình tạo hình ảnh theo từng token — cùng phương pháp tự hồi quy được sử dụng trong mô hình ngôn ngữ GPT. Điều này mang lại khả năng tuân thủ prompt mạnh hơn và bố cục mạch lạc hơn. Mô hình trở nên viral ngay sau khi ra mắt nhờ khả năng tạo hình minh họa phong cách Ghibli.

Trường hợp sử dụng

Khám phá sáng tạo nhanh và tạo bảng tâm trạng. Hình ảnh mạng xã hội và thumbnail. Phác thảo concept sản phẩm. Chỉnh sửa hình ảnh bằng hướng dẫn ngôn ngữ tự nhiên — tải lên tới 5 hình ảnh tham chiếu để định hướng phong cách hoặc bố cục.

Đầu vào

Tất cả tham số được truyền trong đối tượng input của yêu cầu chạy.

ParameterRequiredDescription
promptYesMô tả văn bản của hình ảnh cần tạo (1–4000 ký tự)
aspect_ratioNoTỷ lệ khung hình đầu ra. Mặc định 1:1. Tùy chọn: 1:1, 3:2, 2:3
image_urlsNoTối đa 5 hình ảnh tham chiếu (mỗi ảnh tối đa 4 MB) cho chỉnh sửa hình ảnh

Mẹo viết prompt

Tận dụng chỉ dẫn phong cách

GPT Image 1 rất giỏi với các phong cách nghệ thuật dễ nhận biết. Đề cập đến thẩm mỹ cụ thể — "Studio Ghibli watercolor," "vintage travel poster," "flat vector illustration" — cho kết quả đặc sắc hơn so với mô tả chung chung.

Giữ prompt tập trung

Với chỉ 3 tỷ lệ khung hình và không có điều khiển độ phân giải, bố cục đơn giản hơn thường cho kết quả tốt nhất. Mô tả chủ thể chính và tâm trạng thay vì nhồi nhét chi tiết bố cục.

Hạn chế

  • Chỉ có 3 tỷ lệ khung hình (1:1, 3:2, 2:3)
  • Không có điều khiển độ phân giải — độ phân giải đầu ra do mô hình quyết định
  • Văn bản phức tạp hoặc nhỏ trong hình ảnh có thể cần lặp để đạt độ chính xác
  • Giới hạn prompt 4000 ký tự
  • Tối đa 5 hình ảnh tham chiếu mỗi yêu cầu, mỗi ảnh 4 MB

Câu hỏi thường gặp

GPT Image 1 khác gì so với DALL-E?

GPT Image 1 sử dụng kiến trúc tự hồi quy (tạo theo từng token) thay vì khuếch tán. Điều này thường mang lại khả năng tuân thủ prompt tốt hơn và bố cục mạch lạc hơn.

Có những tỷ lệ khung hình nào?

Ba tùy chọn: 1:1, 3:2, và 2:3. Mặc định là 1:1.

Tôi có thể chỉnh sửa hình ảnh có sẵn không?

Có. Tải lên tới 5 hình ảnh tham chiếu qua image_urls để hướng dẫn quá trình tạo bằng hình ảnh của bạn.