Những học sinh 'đánh bại' AI ở kỳ thi Toán học khó nhất hành tinh

Dù lập kỳ tích ở kỳ thi Olympic Toán học Quốc tế (IMO), AI của Google DeepMind và OpenAI vẫn bị các học sinh tuổi teen đánh bại.
Các mô hình AI tiên tiến nhất của Google DeepMind và OpenAI vừa đạt được bước tiến lớn khi lần đầu giành huy chương vàng tại Olympic Toán học Quốc tế (IMO) – kỳ thi danh giá nhất dành cho học sinh trung học. Song, AI vẫn chưa thể vượt qua con người: 26 học sinh trung học vẫn đạt điểm cao hơn cả hai mô hình AI này.
AI lập kỳ tích tại kỳ thi toán học "khó nhất hành tinh"
IMO là cuộc thi kéo dài hai ngày, mỗi ngày gồm ba bài toán thuộc các lĩnh vực đại số, hình học, tổ hợp và số học. Mỗi bài thi kéo dài hơn 4 tiếng, với đề bài luôn mang tính mới lạ, đòi hỏi khả năng tư duy trừu tượng và sáng tạo vượt bậc – những đặc điểm vốn là thách thức lớn đối với AI.
Từng là điều khó tưởng tượng, nhưng AI giờ đã trở thành "thí sinh" thực thụ tại Olympic Toán học Quốc tế (IMO). Năm ngoái, mô hình AI của DeepMind giành huy chương bạc với 28 điểm. Năm nay, DeepMind trở lại với phiên bản mới – Gemini Deep Think – và chính thức được IMO mời dự thi. Hệ thống đã giải đúng 5/6 bài, đạt 35 điểm và giành huy chương vàng, khiến giới toán học kinh ngạc bởi độ tinh tế và rõ ràng trong lời giải.
Dẫn đầu nỗ lực của DeepMind là Thang Luong, nhà nghiên cứu cấp cao từng suýt được vào đội tuyển IMO của Việt Nam thời trung học. Anh chia sẻ đã chuẩn bị tinh thần chỉ đạt huy chương đồng hoặc bạc, nhưng phải điều chỉnh kỳ vọng khi hệ thống giải trọn vẹn cả ba bài trong ngày thi đầu tiên – một kỳ tích. Ngày thứ hai, AI tiếp tục chinh phục thêm hai bài nữa, đủ điểm huy chương vàng. Nhóm của Luong ăn mừng bằng cách mà thí sinh tuổi teen không thể làm: mở rượu whisky.
Sau lễ bế mạc, OpenAI bất ngờ tuyên bố mô hình riêng của họ – dù không dự thi chính thức – cũng giải được 5 bài, đạt cùng số điểm. Các cựu thí sinh IMO chấm điểm độc lập xác nhận kết quả này. Alexander Wei – người từng nghi ngờ AI sẽ đạt được điều này khi tham gia một khảo sát năm 2021 – nay lại chính là trưởng nhóm nghiên cứu IMO của OpenAI.
Cả hai hệ thống của DeepMind và OpenAI đều sử dụng ngôn ngữ tự nhiên, không cần mã lập trình. DeepMind còn hoàn thành bài trong 4,5 giờ thi tiêu chuẩn, thay vì vài ngày như năm trước.
Các nhà phát triển không xem AI là đối thủ con người mà coi là công cụ hỗ trợ toán học. “Đây có thể là chiếc máy tính mới, tiếp sức cho các thế hệ nhà toán học kế tiếp”, Thang Luong dự đoán.
Những học sinh trung học đánh bại AI
Tại IMO 2025, 72 thí sinh mang "vàng" về nhà. Song, với một số em, huy chương không phải giải thưởng duy nhất: 26 em đạt điểm cao hơn AI. Trong số này, có 4 đại diện của đội tuyển Mỹ, như Qiao “Tiger” Zhang – hai lần giành huy chương vàng, và Alexander Wang – người đã ba năm liên tiếp giành giải vàng và là một trong những thí sinh thành công nhất lịch sử IMO.
“Em nghĩ năm sau AI có thể đạt điểm tuyệt đối”, Wang nhận định. Còn Zhang thận trọng hơn: “Em 50-50”.
Và lý do AI vẫn còn bị bỏ lại phía sau nằm ở Bài toán số 6 – bài toán khó nhất kỳ thi năm nay. Đây là một bài tổ hợp đầy thử thách. Cả DeepMind và OpenAI đều không giải được. 569/630 thí sinh không ghi được điểm nào. Chỉ có 6 người đạt điểm tối đa 7 điểm. Zhang đạt 4 điểm sau khi giành nhiều thời gian nhất cho bài này – điều khiến cậu rất tự hào: “Em sẽ thấy hơi sợ nếu AI giải được bài số 6”.
Mặc dù AI đã đạt cấp độ suy luận và chứng minh toán học cao, nhiều chuyên gia cho rằng vẫn còn một chặng đường dài trước khi AI vượt trội hoàn toàn. TS Junehyuk Jung – cựu thí sinh IMO, hiện là giáo sư tại Đại học Brown và thành viên DeepMind – tin rằng các bài toán dạng như số 6 vẫn sẽ làm khó AI trong ít nhất một thập kỷ tới. “Sẽ có những điều AI làm rất tốt”, ông nói. “Nhưng con người vẫn sẽ làm tốt hơn ở một số lĩnh vực khác”.
Một yếu tố then chốt là sự độc đáo trong đề thi IMO. Chủ tịch IMO, ông Gregor Dolinar, tiết lộ: nếu một bài toán giống bất kỳ đề nào đã từng xuất hiện, nó sẽ bị loại. Điều này khiến AI – vốn dựa vào dữ liệu quá khứ – gặp bất lợi trước các vấn đề hoàn toàn mới.
Về phía con người, các thí sinh như Zhang không chỉ giỏi toán. Cậu còn có khả năng viết lách. Trong bài chia sẻ về hành trình IMO của mình, Zhang kể lại hành trình bắt đầu từ cuộc thi Math Kangaroo năm lớp 2, đến khách sạn ở Úc năm nay – nơi cậu phải giải bài toán tổ hợp khó nhất, giữa những chú chuột túi ngoài cửa sổ.
Đội tuyển Mỹ năm nay giành 5 huy chương vàng và 1 bạc, xếp thứ hai toàn đoàn sau Trung Quốc. Các thí sinh tài năng này không chỉ nhắm đến con đường học thuật, mà còn là đối tượng được săn đón bởi các quỹ đầu tư và công ty công nghệ. IMO năm nay được tài trợ bởi các tên tuổi tài chính như Jane Street và XTX Markets – những nơi đang cạnh tranh gay gắt với Big Tech để chiêu mộ nhân tài toán học.
Trong khi AI đang từng bước tiệm cận năng lực con người, cuộc thi năm nay một lần nữa chứng minh rằng sự sáng tạo, trực giác và tính người trong toán học vẫn là điều máy móc chưa thể thay thế. Và với những thí sinh như Tiger Zhang hay Alexander Wang, giới hạn trí tuệ con người dường như vẫn đang mở rộng – dù phía sau là những mô hình máy tính khổng lồ đang bám sát từng bước.
(Theo WSJ)