GPT Image 1.5 bắt đầu được triển khai cho mọi người dùng ChatGPT và thông qua API (giao diện lập trình ứng dụng) từ tuần này. Tương tự Nano Banana Pro của Google, GPT Image 1.5 cung cấp các tính năng hậu kỳ, cho phép kiểm soát chỉnh sửa chi tiết hơn để duy trì tính nhất quán như độ giống của khuôn mặt, ánh sáng, bố cục, tông màu xuyên suốt quá trình chỉnh sửa.
Đây được coi là bước tiến lớn vì đa số AI tạo ảnh đều kém ở khả năng lặp lại. Khi người dùng yêu cầu chỉnh sửa, ví dụ điều chỉnh biểu cảm khuôn mặt hay làm ánh sáng lạnh hơn, các mô hình thường diễn giải lại toàn bộ hình ảnh, dẫn đến sự thiếu nhất quán.
Ngoài những tính năng mới, bản cập nhật còn cho phép người dùng truy cập tính năng tạo ảnh thông qua một mục riêng ở thanh công cụ của ChatGPT. Theo Fidji Simo, Giám đốc điều hành mảng ứng dụng tại OpenAI, ChatGPT giờ có thể hoạt động như một studio sáng tạo. "Giao diện xem và chỉnh sửa ảnh mới giúp bạn dễ dàng tạo ra những hình ảnh đúng với tưởng tượng hoặc lấy cảm hứng từ những câu lệnh (prompt) thịnh hành và bộ lọc cài sẵn", ông nói.
Ngoài cải tiến công cụ tạo ảnh, OpenAI cũng tìm cách nâng cấp trải nghiệm ChatGPT với nhiều yếu tố trực quan hơn. Theo Simo, công ty dự định hiển thị nhiều hình ảnh hơn kèm nguồn rõ ràng trong các truy vấn tìm kiếm, hữu ích với những tác vụ như chuyển đổi đơn vị đo hay kiểm tra tỷ số thể thao. "Khi sáng tạo, bạn nên được thấy và định hình thứ mình đang làm. Khi hình ảnh truyền tải câu chuyện tốt hơn chỉ có từ ngữ, ChatGPT nên đưa chúng vào", Simo viết.
GPT Image 1.5 là động thái mới nhất của OpenAI, sau khi tung ra mô hình GPT-5.2, trong cuộc cạnh tranh với Google. Tháng trước, Sam Altman, CEO OpenAI, kích hoạt tình trạng "báo động đỏ", đề ra kế hoạch đảm bảo vị thế dẫn đầu trong lĩnh vực AI sau khi Google công bố Gemini 3 và trình tạo ảnh Nano Banana Pro, đều đứng đầu về nhiều tiêu chí đánh giá trên bảng xếp hạng LMArena.
Thu Thảo (Theo TechCrunch, The Verge)
