Ứng dụng Gemini có bước đột phá với tính năng mới

AI Gemini đã cho phép người dùng tải video lên và hỏi bất cứ điều gì về nó.
Theo Neowin, Google đang dần tung ra một trong những bản cập nhật đáng giá nhất cho ứng dụng Gemini kể từ khi ra mắt, đó là khả năng tải lên và phân tích video cá nhân. Tính năng này hứa hẹn sẽ biến Gemini thành một trợ lý đa phương tiện thực thụ, có khả năng 'xem' và 'hiểu' nội dung video của chính bạn.
'Mắt thần' mới của AI Gemini hoạt động như thế nào?
Không chỉ dừng lại ở việc phân tích văn bản, hình ảnh hay các đường link từ YouTube, giờ đây người dùng có thể tải lên một tệp video trực tiếp từ thư viện điện thoại của mình và đặt câu hỏi cho Gemini về nội dung bên trong.
Để chứng minh sức mạnh của tính năng này, các thử nghiệm ban đầu cho thấy kết quả vô cùng ấn tượng.
Về mặt thực tế: Trong một ví dụ, người dùng đã tải lên một video ngắn và hỏi Gemini về thời gian đang được hiển thị trên một chiếc đồng hồ Nest Hub trong clip và AI đã trả lời chính xác.
Về mặt mô tả và cảm nhận: Trong một thử nghiệm khác, khi được yêu cầu mô tả một video về khu rừng mùa thu, Gemini đã đưa ra một đoạn văn chi tiết và đầy chất thơ: "Đây có vẻ là một khung cảnh yên bình từ một khu rừng vào mùa thu. Một con đường mòn hẹp, phủ đầy lá rụng với các sắc thái cam, nâu và vàng... Ánh nắng mặt trời len lỏi qua các cành cây, tạo ra ánh sáng và bóng đổ lốm đốm... Có một không khí thanh bình và yên tĩnh, hoàn hảo cho một cuộc dạo bộ".
Điều này cho thấy Gemini không chỉ nhận diện được các đối tượng, mà còn có khả năng hiểu được bối cảnh, không khí và cảm xúc trong một video.
Hiện tại, tính năng này vẫn chưa được triển khai rộng rãi và đang được Google tung ra theo từng đợt. Để kiểm tra xem tài khoản của bạn đã được cập nhật hay chưa, hãy làm theo các bước sau:
Theo ghi nhận, tính năng này đang xuất hiện cho cả người dùng miễn phí và trả phí trên Android (thông qua ứng dụng Google beta) và iOS. Tuy nhiên, nó vẫn chưa có mặt trên phiên bản web. Có thể thấy, việc Google bổ sung khả năng phân tích video là một bước tiến lớn, đưa Gemini đến gần hơn với một trợ lý AI toàn năng, có thể tương tác với thế giới một cách trực quan và sâu sắc hơn.