AI có thực sự "vô dụng" khi hỏi về tỉnh thành mới của Việt Nam? Đừng đổ lỗi cho AI khi bạn không biết cách dùng sao cho đúng!

Nhiều người cho rằng AI như ChatGPT hay Gemini không thể trả lời đúng về các tỉnh thành mới sau sáp nhập, nhưng thực tế vấn đề không nằm ở AI, mà ở cách sử dụng của con người và giới hạn vốn có của công nghệ này.
Gần đây, khi Việt Nam thực hiện sáp nhập đơn vị hành chính, trên mạng xuất hiện hàng loạt ý kiến cảnh báo:"Đừng hỏi ChatGPT về tỉnh thành mới, toàn trả lời sai" . Quả thực, khi hỏi số lượng tỉnh thành hiện tại, hầu hết mô hình AI phổ biến đều trả lời con số 63 thay vì 34 theo Nghị quyết mới. Vậy AI thực sự "vô dụng" đến thế, hay vấn đề nằm ở cách chúng ta đang sử dụng công cụ này?
Theo nghiên cứu FRESHLLMS được công bố tại Hội nghị Ngôn ngữ học tính toán ACL 2024, hầu hết các mô hình ngôn ngữ lớn (LLMs) không được cập nhật dữ liệu theo thời gian thực. Ví dụ, GPT-4 Turbo chỉ có mốc cutoff dữ liệu (thời điểm mà AI không còn được cập nhật kiến thức) đến tháng 4/2023, tương tự mô hình GPT-4o phổ biến nhất của ChatGPT có mốc cutoff dữ liệu là tháng 6/2024. Thông tin này người dùng hoàn toàn có thể hỏi thẳng ChatGPT bằng một lệnh ví dụ như"Dữ liệu của bạn được cập nhật tới ngày nào?". Điều này có nghĩa, mọi sự kiện hành chính sau thời điểm đó sẽ không xuất hiện trong bộ dữ liệu huấn luyện của AI.
Nghiên cứu cũng chỉ ra rằng, trong bài benchmark FRESHQA gồm 600 câu hỏi kiểm tra khả năng trả lời kiến thức cập nhật, mọi mô hình AI không được tích hợp tìm kiếm web đều có accuracy (độ chính xác câu trả lời) dưới 32% ở chế độ STRICT (đòi hỏi câu trả lời không sai lệch hoặc "hallucination", hiện tượng "ảo giác" của AI). Thậm chí với câu hỏi thuộc nhóm fast-changing (thay đổi nhanh), accuracy trung bình chỉ khoảng 15% dù là GPT-4 hay các LLM lớn khác.
Tuy nhiên, khi kết hợp với công cụ tìm kiếm, kết quả thay đổi rõ rệt. Phương pháp FRESHPROMPT, tích hợp dữ liệu mới từ Google Search vào prompt của GPT-4, giúp accuracy tăng từ 28,6% lên 75,6% ở chế độ STRICT, và giảm mạnh tỷ lệ những câu trả lời outdated (lỗi thời, không phù hợp với bối cảnh hiện tại) hoặc bịa đặt do "ảo giác". Đây là minh chứng rõ rệt cho thấy AI không yếu, vấn đề nằm ở cách khai thác.
Ngoài ra, hầu hết AI hiện nay đều đính kèm cảnh báo "AI can make mistakes. Use with your own risk" (AI có thể mắc lỗi. Hãy tự chịu trách nhiệm khi sử dụng). Đây không chỉ là câu từ chối trách nhiệm mang tính pháp lý mà còn phản ánh bản chất: AI là công cụ hỗ trợ, tổng hợp và tham khảo, không thay thế nguồn dữ liệu chính thức và bản thân người sử dụng PHẢI nhận thức được vấn đề này.
Thực tế, việc AI trả lời sai về tỉnh thành mới không chứng minh công nghệ này vô dụng hay không đáng tin. Ngược lại, AI vẫn là công cụ cực kỳ mạnh mẽ khi bản thân người dùng biết cách sử dụng và khai thác: đặt câu hỏi đúng, bật tính năng tìm kiếm web, sử dụng tính năng nghiên cứu sâu khi cần nghiên cứu về một vấn đề nào đó và luôn kiểm chứng thông tin trước khi đưa ra quyết định quan trọng. Đừng kỳ vọng AI "biết tất cả", nhưng cũng đừng bỏ qua tiềm năng của nó chỉ vì những giới hạn vốn có hay chỉ vì bạn không biết cách sử dụng sao cho đúng.