AI có thực sự "vô dụng" khi hỏi về tỉnh thành mới của Việt Nam? Đừng đổ lỗi cho AI khi bạn không biết cách dùng sao cho đúng!

Nhiều người cho rằng AI như ChatGPT hay Gemini không thể trả lời đúng về các tỉnh thành mới sau sáp nhập, nhưng thực tế vấn đề không nằm ở AI, mà ở cách sử dụng của con người và giới hạn vốn có của công nghệ này.

Gần đây, khi Việt Nam thực hiện sáp nhập đơn vị hành chính, trên mạng xuất hiện hàng loạt ý kiến cảnh báo:"Đừng hỏi ChatGPT về tỉnh thành mới, toàn trả lời sai" . Quả thực, khi hỏi số lượng tỉnh thành hiện tại, hầu hết mô hình AI phổ biến đều trả lời con số 63 thay vì 34 theo Nghị quyết mới. Vậy AI thực sự "vô dụng" đến thế, hay vấn đề nằm ở cách chúng ta đang sử dụng công cụ này?

Theo nghiên cứu FRESHLLMS được công bố tại Hội nghị Ngôn ngữ học tính toán ACL 2024, hầu hết các mô hình ngôn ngữ lớn (LLMs) không được cập nhật dữ liệu theo thời gian thực. Ví dụ, GPT-4 Turbo chỉ có mốc cutoff dữ liệu (thời điểm mà AI không còn được cập nhật kiến thức) đến tháng 4/2023, tương tự mô hình GPT-4o phổ biến nhất của ChatGPT có mốc cutoff dữ liệu là tháng 6/2024. Thông tin này người dùng hoàn toàn có thể hỏi thẳng ChatGPT bằng một lệnh ví dụ như"Dữ liệu của bạn được cập nhật tới ngày nào?". Điều này có nghĩa, mọi sự kiện hành chính sau thời điểm đó sẽ không xuất hiện trong bộ dữ liệu huấn luyện của AI.

Nghiên cứu cũng chỉ ra rằng, trong bài benchmark FRESHQA gồm 600 câu hỏi kiểm tra khả năng trả lời kiến thức cập nhật, mọi mô hình AI không được tích hợp tìm kiếm web đều có accuracy (độ chính xác câu trả lời) dưới 32% ở chế độ STRICT (đòi hỏi câu trả lời không sai lệch hoặc "hallucination", hiện tượng "ảo giác" của AI). Thậm chí với câu hỏi thuộc nhóm fast-changing (thay đổi nhanh), accuracy trung bình chỉ khoảng 15% dù là GPT-4 hay các LLM lớn khác.

Tuy nhiên, khi kết hợp với công cụ tìm kiếm, kết quả thay đổi rõ rệt. Phương pháp FRESHPROMPT, tích hợp dữ liệu mới từ Google Search vào prompt của GPT-4, giúp accuracy tăng từ 28,6% lên 75,6% ở chế độ STRICT, và giảm mạnh tỷ lệ những câu trả lời outdated (lỗi thời, không phù hợp với bối cảnh hiện tại) hoặc bịa đặt do "ảo giác". Đây là minh chứng rõ rệt cho thấy AI không yếu, vấn đề nằm ở cách khai thác.

Ngoài ra, hầu hết AI hiện nay đều đính kèm cảnh báo "AI can make mistakes. Use with your own risk" (AI có thể mắc lỗi. Hãy tự chịu trách nhiệm khi sử dụng). Đây không chỉ là câu từ chối trách nhiệm mang tính pháp lý mà còn phản ánh bản chất: AI là công cụ hỗ trợ, tổng hợp và tham khảo, không thay thế nguồn dữ liệu chính thức và bản thân người sử dụng PHẢI nhận thức được vấn đề này.

Thực tế, việc AI trả lời sai về tỉnh thành mới không chứng minh công nghệ này vô dụng hay không đáng tin. Ngược lại, AI vẫn là công cụ cực kỳ mạnh mẽ khi bản thân người dùng biết cách sử dụng và khai thác: đặt câu hỏi đúng, bật tính năng tìm kiếm web, sử dụng tính năng nghiên cứu sâu khi cần nghiên cứu về một vấn đề nào đó và luôn kiểm chứng thông tin trước khi đưa ra quyết định quan trọng. Đừng kỳ vọng AI "biết tất cả", nhưng cũng đừng bỏ qua tiềm năng của nó chỉ vì những giới hạn vốn có hay chỉ vì bạn không biết cách sử dụng sao cho đúng.

Nguồn CafeF: https://cafef.vn/ai-co-thuc-su-vo-dung-khi-hoi-ve-tinh-thanh-moi-cua-viet-nam-dung-do-loi-cho-ai-khi-ban-khong-biet-cach-dung-sao-cho-dung-188250702150015648.chn

tỉnh thành

ChatGPT

Tin liên quan

CMC tìm kiếm đối tác phát triển thêm các trung tâm dữ liệu siêu quy mô trong 3 năm tới

Từ ngày 16 đến 22/9/2025, đoàn công tác cấp cao do Bộ Tài chính Việt Nam chủ trì đã có chuyến làm việc tại Vương quốc

CafeF 5 giờ trước

Công ty robot do con trai tỷ phú ô tô sáng lập vừa gọi được vốn khủng sau 4 tháng thành lập

Mặc dù mới thành lập, công ty đã huy động được vốn nhanh chóng.

CafeF 6 giờ trước

AI hỗ trợ đắc lực cho các chiến dịch "siêu sale"

AI không chỉ giúp gia tăng hiệu quả chuyển đổi, mà còn biến những quy trình giao dịch thuần túy trở thành trải nghiệm

CafeF 7 giờ trước

FPT hợp tác với "ông lớn" châu Âu trong chuyển đổi số ngành ngân hàng, tài chính, bảo hiểm

Vừa qua, FPT đã ký biên bản ghi nhớ với Future Processing - công ty công nghệ hàng đầu châu Âu, nhằm thúc đẩy chuyển

CafeF 8 giờ trước

Điện thoại đang hoạt động bình thường thì có dấu hiệu này: Cận thận bị hacker quét sạch tiền trong tài khoản!

Bạn có nhận thấy điện thoại hoặc máy tính của mình đột nhiên chậm, pin tụt nhanh bất thường, hoặc xuất hiện ứng dụng

CafeF 9 giờ trước

Hứa hẹn lợi nhuận tới 21%/tháng, hàng nghìn người Việt liên tục sập bẫy “dự án đầu tư tiền ảo”: Chuyên gia đưa ra cảnh báo

Chỉ trong thời gian ngắn kể từ khi tiếp nhận báo cáo từ ChainTracer (Chương trình trọng điểm của VBA), Cục Cảnh

CafeF 11 giờ trước

Trung tướng Nguyễn Minh Chính: Tội phạm dùng AI để lừa đảo, tấn công mạng

AI đặt ra không ít thách thức trên thực tế, khi tội phạm mạng lợi dụng để tạo mã độc, làm giả giọng nói, khuôn mặt, v

CafeF 12 giờ trước

Savvycom 'bắt tay' với Viettel IDC trong lĩnh vực được dự báo đạt khoảng 213,7 tỷ USD vào năm 2028

Chi tiêu cho hạ tầng điện toán đám mây toàn cầu dự kiến đạt khoảng 213,7 tỷ USD vào năm 2028, với mức tăng trưởng tru

CafeF 12 giờ trước

Coi chừng mất tiền triệu: 7 trường hợp người dân phải đăng kí thường trú năm 2025

Từ năm 2025, người dân thuộc 7 trường hợp chuyển đến chỗ ở hợp pháp mới phải đăng ký thường trú trong 12 tháng, nếu k

CafeF 13 giờ trước

Bất chấp biến động, TikTok Shop vẫn nhắm tăng gấp 2 doanh thu tại Mỹ, là bộ phận phát triển nhanh nhất ByteDance

Bên cạnh lệnh cấm bị đe dọa, thuế quan tăng cao và các rào cản thương mại khác, hoạt động thương mại điện tử của công

CafeF 14 giờ trước

Hiện thực hoá mục tiêu đưa blockchain “Make in Vietnam” vươn tầm quốc tế, 1Matrix 'bắt tay' với loạt ông lớn về dữ liệu top đầu Đông Nam Á và thế giới

Sự kiện đánh dấu giai đoạn phát triển mới, góp phần thúc đẩy những sáng kiến blockchain 'Make in Vietnam' vươn tầm qu

CafeF 16 giờ trước

Dubai mong muốn tổ chức sự kiện lớn nhất vùng Vịnh tại Việt Nam, Phó Thủ tướng có đề nghị gì?

Riêng năm 2022, sự kiện này đã tạo ra hơn 2,6 tỷ AED (gần 700 triệu USD) giá trị kinh tế, thu hút 170.000 khách tham

CafeF 16 giờ trước

Vì sao kẻ gian dễ dàng đánh cắp thông tin cá nhân, chiếm quyền kiểm soát tài khoản ngân hàng của người dùng

SQL Injection (SQLi) vẫn được xếp trong nhóm lỗ hổng nguy hiểm hàng đầu trên các ứng dụng web.

CafeF 16 giờ trước

Chỉ 4% người dùng dùng ChatGPT để lập trình, còn lại làm gì?

Báo cáo nghiên cứu mới nhất cho thấy việc lập trình chỉ chiếm một phần rất nhỏ trong cách con người sử dụng ChatGPT,

CafeF 16 giờ trước

Phát hiện 2.500 kg vàng trị giá 7 tỷ đồng bị bỏ ngoài hố rác

Kho báu khủng được phát hiện ngoài bãi rác.

CafeF 16 giờ trước

AI có thực sự "vô dụng" khi hỏi về tỉnh thành mới của Việt Nam? Đừng đổ lỗi cho AI khi bạn không biết cách dùng sao cho đúng!

Tin liên quan

Tin nổi bật