Google Gemini nâng tầm AI: đổi nền, kiểu tóc, ghép ảnh chỉ bằng một câu lệnh

Với bản cập nhật mới, Google Gemini cho phép người dùng đổi phông nền, kiểu tóc, ghép ảnh mà vẫn giữ nguyên khuôn mặt và đặc điểm nhận dạng của chủ thể.

Bản nâng cấp của Google Gemini sử dụng mô hình hình ảnh “nano banana” do Google DeepMind phát triển. Tính năng hiện đã có mặt trên toàn cầu cho cả người dùng miễn phí lẫn trả phí. Điểm mạnh lớn nhất là khả năng giữ sự nhất quán khuôn mặt và đối tượng trong ảnh, điều mà các công cụ AI khác thường gặp khó khăn.

Nicole Brichtova, trưởng nhóm sản phẩm tại DeepMind, chia sẻ: “Chúng tôi thực sự đẩy mạnh chất lượng hình ảnh cũng như khả năng làm theo hướng dẫn của mô hình. Bản cập nhật này giúp các chỉnh sửa liền mạch hơn và kết quả đủ tốt để dùng cho bất kỳ mục đích nào”.

Giữ “bạn” trong từng tấm ảnh

Một trong những điểm khiến ảnh AI có cảm giác giả tạo là các chi tiết nhỏ bị méo mó. Google cho biết Gemini giải quyết được vấn đề này, cho phép thay đổi toàn bộ bối cảnh nhưng vẫn giữ nguyên gương mặt và thần thái. Người dùng có thể thử kiểu tóc mới, đổi màu tường hay đưa thú cưng vào cảnh mà không lo biến dạng hình ảnh.

Gemini cũng cho phép tải nhiều ảnh để ghép thành một, chẳng hạn kết hợp chân dung với mèo cưng để tạo bức ảnh hai bạn cùng vi vu trên đường.

Gemini hỗ trợ chỉnh sửa nhiều bước (multi-turn editing), giúp người dùng thêm từng chi tiết cho một không gian: từ giấy dán tường, bàn ghế, đến màu sơn. Điểm cộng là chỉ phần cần chỉnh sửa thay đổi, còn lại giữ nguyên.

Ngoài ra, Gemini có thể trộn phong cách giữa các ảnh. Ví dụ, biến đôi ủng đi mưa thành đôi giày in hình cánh hoa, hoặc tạo chiếc váy mang họa tiết cánh bướm.

Cuộc đua tạo ảnh AI giữa các “ông lớn” công nghệ

Nâng cấp của Google diễn ra khi cuộc chiến tạo ảnh bằng AI ngày càng khốc liệt. OpenAI trước đó ra mắt GPT-4o với khả năng tạo ảnh trực tiếp, từng gây sốt mạng xã hội với loạt meme phong cách Studio Ghibli. CEO Sam Altman tiết lộ lượng người dùng tăng mạnh đến mức GPU của công ty gần như “nóng chảy”.

Để theo kịp, Meta tuyên bố hợp tác với Midjourney, trong khi startup Đức Black Forest Labs với mô hình FLUX đang chiếm ưu thế trên nhiều bảng xếp hạng.

Google kỳ vọng Gemini có thể thu hẹp khoảng cách với ChatGPT. Theo CEO Sundar Pichai, Gemini hiện đạt 450 triệu người dùng hàng tháng, thấp hơn nhiều so với ChatGPT vốn có hơn 700 triệu người dùng mỗi tuần.

Brichtova cho biết Gemini được thiết kế cho các tình huống thực tế, từ hình dung phòng khách, khu vườn đến tạo ảnh giải trí. Mô hình có “kiến thức thế giới” tốt hơn, có thể kết hợp nhiều ảnh và bảng màu thành một render hoàn chỉnh.

Tuy nhiên, Google cũng đặt ra giới hạn nghiêm ngặt. Mọi ảnh sinh ra đều có watermark rõ ràng và dấu nhận dạng ẩn trong metadata. Công ty cấm tuyệt đối việc tạo ảnh nhạy cảm phi tự nguyện để tránh lạm dụng deepfake.

Trước đó, Google từng phải xin lỗi vì Gemini tạo ra hình ảnh lịch sử không chính xác. Lần này, hãng tin rằng mình đã đạt được sự cân bằng giữa sáng tạo và an toàn. “Chúng tôi muốn người dùng sáng tạo nhưng không phải cái gì cũng được phép”, Brichtova nhấn mạnh.

Với Gemini 2.5 Flash Image, Google đặt cược vào việc nâng tầm trải nghiệm chỉnh ảnh AI, hy vọng giữ chân người dùng cũ và thu hút thêm người mới trong cuộc đua công nghệ khốc liệt với OpenAI, Meta và các đối thủ khác.

(Theo TechCrunch, Tom's Guide)

Nguồn VietNamNet: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html

Google Gemini

Tin liên quan

Chuyên gia Ericsson sẽ trực tiếp giảng dạy về 5G cho sinh viên Đại học Giao thông Vận tải

Ericsson hợp tác cùng Đại học Giao thông Vận tải để đào tạo sinh viên tiên phong ứng dụng 5G, trong đó có hệ thống đư

VietNamNet 5 giờ trước

ChatGPT bị kiện vì xúi trẻ tự tử

Đơn kiện dẫn lại nhiều đoạn hội thoại, trong đó ChatGPT nói với Adam rằng 'cậu không nợ ai việc phải tiếp tục sống' v

Tuổi Trẻ 7 giờ trước

Chuyên gia cảnh báo nhiều chiêu trò lừa đảo lợi dụng dịp kỷ niệm Quốc khánh 2-9

Lợi dụng sự quan tâm đặc biệt của người dân tới lễ kỷ niệm 80 năm Quốc khánh 2-9, kẻ xấu tung chiêu trò lừa đảo và đă

Tuổi Trẻ 8 giờ trước

Loạt máy có thể bị Apple 'khai tử' vào đầu tháng 9

Với sự kiện ra mắt 4 dòng iPhone 17 mới, Apple sẽ không còn bày bán một số mẫu điện thoại tại cửa hàng của mình nữa.

ZNews 8 giờ trước

Thiết bị báo rung quán đồ uống gây nhiễu làm tê liệt loạt ô tô, xe máy tại Hải Phòng

"Thủ phạm" gây nhiễu cho các ô tô, xe máy tại Hải Phòng là bộ thiết bị báo rung không dây TRND16 được sử dụng để thôn

VietNamNet 8 giờ trước

Sức công phá của 2 loại tên lửa xuất hiện trong hợp luyện diễu binh

Tổ hợp S-125-VT và Tổ hợp Trường Sơn là 2 loại tên lửa đối không và đối hạm đã xuất hiện tại tổng hợp luyện diễu binh

ZNews 9 giờ trước

Tai nghe Galaxy Buds Core: chống ồn, dịch trực tiếp, giá chỉ hơn 1 triệu đồng

Samsung Việt Nam vừa giới thiệu Galaxy Buds Core - mẫu tai nghe không dây mới có thiết kế One Body nhỏ gọn, hướng đến

VietNamNet 10 giờ trước

Amazon muốn triển khai Internet vệ tinh tại Việt Nam

Thứ trưởng Bộ KH&CN đã có buổi nói chuyện với đại diện Amazon, hướng đến hoàn thiện hồ sơ dự án băng thông rộng c

ZNews 10 giờ trước

Hơn 69.000 người tham gia cuộc thi trực tuyến ‘Tìm hiểu về Bộ, Ngành Tư pháp’

Cuộc thi trực tuyến “Tìm hiểu về Bộ, Ngành Tư pháp” nhân kỷ niệm 80 năm Ngày Truyền thống ngành đã thu hút 69.324 ngư

VietNamNet 11 giờ trước

Hướng đi mới của Panasonic

Tại Đông Nam Á, hãng điện tử Nhật Bản theo đuổi phân khúc máy sấy tóc cao cấp để tiếp cận lớp khách hàng trung lưu đa

ZNews 11 giờ trước

Cộng đồng người dùng Zalo hòa cùng chiến dịch 'Tự hào Việt Nam'

Zalo phát động chiến dịch “Tự hào Việt Nam” với các hoạt động gồm cập nhật bộ giao diện trang cá nhân và hình đại diệ

ZNews 11 giờ trước

CMC Telecom cùng Google, CrowdStrike tổ chức hội thảo an ninh mạng ứng dụng AI

Hội thảo chuyên sâu “Phòng thủ chủ động với AI trong kỷ nguyên đa nền tảng” dành riêng cho ngành tài chính - ngân hàn

VietNamNet 12 giờ trước

Bí quyết làm chủ cuộc sống của các lãnh đạo cao cấp Việt nhờ vào AI

(Dân trí) - Các nhà lãnh đạo cấp cao (C-suite) của nhiều doanh nghiệp Việt vừa có buổi chia sẻ về cách làm chủ thời g

Dân Trí 12 giờ trước

Thiệp mời sự kiện iPhone 17 của Apple gây chú ý

Đây là lần đầu tiên Apple sử dụng thiết kế logo dạng tương tác trực tiếp trên website chính thức, với tạo hình dạng t

ZNews 13 giờ trước

Cảnh giác với lừa đảo công nghệ cao dịp Quốc khánh 2/9

(Dân trí) - Lợi dụng sự kiện 80 năm Quốc khánh 2/9, tội phạm mạng đang gia tăng hoạt động với nhiều thủ đoạn như lừa

Dân Trí 13 giờ trước

Google Gemini nâng tầm AI: đổi nền, kiểu tóc, ghép ảnh chỉ bằng một câu lệnh

Tin liên quan

Tin nổi bật