Những học sinh 'đánh bại' AI ở kỳ thi Toán học khó nhất hành tinh

Dù lập kỳ tích ở kỳ thi Olympic Toán học Quốc tế (IMO), AI của Google DeepMind và OpenAI vẫn bị các học sinh tuổi teen đánh bại.

Các mô hình AI tiên tiến nhất của Google DeepMind và OpenAI vừa đạt được bước tiến lớn khi lần đầu giành huy chương vàng tại Olympic Toán học Quốc tế (IMO) – kỳ thi danh giá nhất dành cho học sinh trung học. Song, AI vẫn chưa thể vượt qua con người: 26 học sinh trung học vẫn đạt điểm cao hơn cả hai mô hình AI này.

AI lập kỳ tích tại kỳ thi toán học "khó nhất hành tinh"

IMO là cuộc thi kéo dài hai ngày, mỗi ngày gồm ba bài toán thuộc các lĩnh vực đại số, hình học, tổ hợp và số học. Mỗi bài thi kéo dài hơn 4 tiếng, với đề bài luôn mang tính mới lạ, đòi hỏi khả năng tư duy trừu tượng và sáng tạo vượt bậc – những đặc điểm vốn là thách thức lớn đối với AI.

Từng là điều khó tưởng tượng, nhưng AI giờ đã trở thành "thí sinh" thực thụ tại Olympic Toán học Quốc tế (IMO). Năm ngoái, mô hình AI của DeepMind giành huy chương bạc với 28 điểm. Năm nay, DeepMind trở lại với phiên bản mới – Gemini Deep Think – và chính thức được IMO mời dự thi. Hệ thống đã giải đúng 5/6 bài, đạt 35 điểm và giành huy chương vàng, khiến giới toán học kinh ngạc bởi độ tinh tế và rõ ràng trong lời giải.

Dẫn đầu nỗ lực của DeepMind là Thang Luong, nhà nghiên cứu cấp cao từng suýt được vào đội tuyển IMO của Việt Nam thời trung học. Anh chia sẻ đã chuẩn bị tinh thần chỉ đạt huy chương đồng hoặc bạc, nhưng phải điều chỉnh kỳ vọng khi hệ thống giải trọn vẹn cả ba bài trong ngày thi đầu tiên – một kỳ tích. Ngày thứ hai, AI tiếp tục chinh phục thêm hai bài nữa, đủ điểm huy chương vàng. Nhóm của Luong ăn mừng bằng cách mà thí sinh tuổi teen không thể làm: mở rượu whisky.

Sau lễ bế mạc, OpenAI bất ngờ tuyên bố mô hình riêng của họ – dù không dự thi chính thức – cũng giải được 5 bài, đạt cùng số điểm. Các cựu thí sinh IMO chấm điểm độc lập xác nhận kết quả này. Alexander Wei – người từng nghi ngờ AI sẽ đạt được điều này khi tham gia một khảo sát năm 2021 – nay lại chính là trưởng nhóm nghiên cứu IMO của OpenAI.

Cả hai hệ thống của DeepMind và OpenAI đều sử dụng ngôn ngữ tự nhiên, không cần mã lập trình. DeepMind còn hoàn thành bài trong 4,5 giờ thi tiêu chuẩn, thay vì vài ngày như năm trước.

Các nhà phát triển không xem AI là đối thủ con người mà coi là công cụ hỗ trợ toán học. “Đây có thể là chiếc máy tính mới, tiếp sức cho các thế hệ nhà toán học kế tiếp”, Thang Luong dự đoán.

Những học sinh trung học đánh bại AI

Tại IMO 2025, 72 thí sinh mang "vàng" về nhà. Song, với một số em, huy chương không phải giải thưởng duy nhất: 26 em đạt điểm cao hơn AI. Trong số này, có 4 đại diện của đội tuyển Mỹ, như Qiao “Tiger” Zhang – hai lần giành huy chương vàng, và Alexander Wang – người đã ba năm liên tiếp giành giải vàng và là một trong những thí sinh thành công nhất lịch sử IMO.

“Em nghĩ năm sau AI có thể đạt điểm tuyệt đối”, Wang nhận định. Còn Zhang thận trọng hơn: “Em 50-50”.

Và lý do AI vẫn còn bị bỏ lại phía sau nằm ở Bài toán số 6 – bài toán khó nhất kỳ thi năm nay. Đây là một bài tổ hợp đầy thử thách. Cả DeepMind và OpenAI đều không giải được. 569/630 thí sinh không ghi được điểm nào. Chỉ có 6 người đạt điểm tối đa 7 điểm. Zhang đạt 4 điểm sau khi giành nhiều thời gian nhất cho bài này – điều khiến cậu rất tự hào: “Em sẽ thấy hơi sợ nếu AI giải được bài số 6”.

Mặc dù AI đã đạt cấp độ suy luận và chứng minh toán học cao, nhiều chuyên gia cho rằng vẫn còn một chặng đường dài trước khi AI vượt trội hoàn toàn. TS Junehyuk Jung – cựu thí sinh IMO, hiện là giáo sư tại Đại học Brown và thành viên DeepMind – tin rằng các bài toán dạng như số 6 vẫn sẽ làm khó AI trong ít nhất một thập kỷ tới. “Sẽ có những điều AI làm rất tốt”, ông nói. “Nhưng con người vẫn sẽ làm tốt hơn ở một số lĩnh vực khác”.

Một yếu tố then chốt là sự độc đáo trong đề thi IMO. Chủ tịch IMO, ông Gregor Dolinar, tiết lộ: nếu một bài toán giống bất kỳ đề nào đã từng xuất hiện, nó sẽ bị loại. Điều này khiến AI – vốn dựa vào dữ liệu quá khứ – gặp bất lợi trước các vấn đề hoàn toàn mới.

Về phía con người, các thí sinh như Zhang không chỉ giỏi toán. Cậu còn có khả năng viết lách. Trong bài chia sẻ về hành trình IMO của mình, Zhang kể lại hành trình bắt đầu từ cuộc thi Math Kangaroo năm lớp 2, đến khách sạn ở Úc năm nay – nơi cậu phải giải bài toán tổ hợp khó nhất, giữa những chú chuột túi ngoài cửa sổ.

Đội tuyển Mỹ năm nay giành 5 huy chương vàng và 1 bạc, xếp thứ hai toàn đoàn sau Trung Quốc. Các thí sinh tài năng này không chỉ nhắm đến con đường học thuật, mà còn là đối tượng được săn đón bởi các quỹ đầu tư và công ty công nghệ. IMO năm nay được tài trợ bởi các tên tuổi tài chính như Jane Street và XTX Markets – những nơi đang cạnh tranh gay gắt với Big Tech để chiêu mộ nhân tài toán học.

Trong khi AI đang từng bước tiệm cận năng lực con người, cuộc thi năm nay một lần nữa chứng minh rằng sự sáng tạo, trực giác và tính người trong toán học vẫn là điều máy móc chưa thể thay thế. Và với những thí sinh như Tiger Zhang hay Alexander Wang, giới hạn trí tuệ con người dường như vẫn đang mở rộng – dù phía sau là những mô hình máy tính khổng lồ đang bám sát từng bước.

(Theo WSJ)

Nguồn VietNamNet: https://vietnamnet.vn/nhung-hoc-sinh-vuot-mat-ai-o-ky-thi-toan-hoc-quoc-te-kho-nhat-hanh-tinh-2426644.html

toán học

Olympic Toán học quốc tế

IMO 2025

Tin liên quan

Dòng iPhone này sắp bị Apple ‘khai tử’?

iPhone Air đang thất bại với doanh số thấp và không được người dùng quan tâm.

VietNamNet 9 giờ trước

iPhone 18 Pro sẽ có màu mới

Bên cạnh những nâng cấp về hiệu năng và thiết kế, iPhone 18 Pro có thể sẽ gây chú ý với màu sắc hoàn toàn mới, đánh d

ZNews 11 giờ trước

iPhone 18 Pro sẽ có màu mới

Bên cạnh những nâng cấp về hiệu năng và thiết kế, iPhone 18 Pro có thể sẽ gây chú ý với màu sắc hoàn toàn mới, đánh d

ZNews 11 giờ trước

Hong Kong phong tỏa 354 triệu USD liên quan trùm lừa đảo Campuchia Chen Zhi

Chính quyền Hong Kong (Trung Quốc) đã phong tỏa số tài sản trị giá 2,75 tỷ HKD (354 triệu USD) liên quan đến tập đoàn

VietNamNet 11 giờ trước

Hong Kong phong tỏa 354 triệu USD liên quan trùm lừa đảo Campuchia Chen Zhi

Chính quyền Hong Kong (Trung Quốc) đã phong tỏa số tài sản trị giá 2,75 tỷ HKD (354 triệu USD) liên quan đến tập đoàn

VietNamNet 11 giờ trước

Sếp Trung Quốc cắt quần robot để chứng minh không phải là người

Màn trình diễn robot Iron của Xpeng gây tranh cãi đến mức nhà sáng lập He Xiaopeng phải mở khóa, khoe linh kiện bên t

ZNews 12 giờ trước

Sếp Trung Quốc cắt quần robot để chứng minh không phải là người

Màn trình diễn robot Iron của Xpeng gây tranh cãi đến mức nhà sáng lập He Xiaopeng phải mở khóa, khoe linh kiện bên t

ZNews 12 giờ trước

Sếp Trung Quốc cắt quần robot để chứng minh không phải là người

Màn trình diễn robot Iron của Xpeng gây tranh cãi đến mức nhà sáng lập He Xiaopeng phải mở khóa, khoe linh kiện bên t

ZNews 12 giờ trước

Số hóa quản lý tài sản giúp tối ưu chi phí vận hành doanh nghiệp

T.FM là giải pháp phần mềm “Make in Vietnam” đạt chứng nhận 5 sao, tiên phong theo xu hướng số hóa quản lý tài sản gi

VietNamNet 14 giờ trước

Bộ KH&CN đã trình Quốc hội dự thảo Luật Trí tuệ nhân tạo

Theo ông Hồ Đức Thắng, Viện trưởng Viện Công nghệ số và Chuyển đổi số quốc gia (Bộ KH&CN), ngày 7/11, thay mặt Ch

VietNamNet 14 giờ trước

Cơ hội mới để doanh nghiệp Việt Nam tham gia sâu hơn vào chuỗi cung ứng bán dẫn

Khoảng 90% giá trị tạo ra trong ngành sản xuất chip tại Hà Lan đến từ các nhà cung ứng, chứ không phải từ nhà sản xuấ

VietNamNet 15 giờ trước

Đan Mạch cấm trẻ em dưới 15 tuổi dùng mạng xã hội

Chính phủ Đan Mạch thông báo nước này sẽ ban hành quy định cấm trẻ em dưới 15 tuổi truy cập mạng xã hội.

Tuổi Trẻ 15 giờ trước

Giải mã ‘kẻ thua cuộc vĩ đại’ A-545 Kord với công nghệ BARS ‘ma thuật’ suýt cướp ‘ngôi vương’ AK

Súng trường tấn công A-545 Kord không chỉ kế thừa tinh hoa AEK-971 mà còn vượt trội AK-74 về độ chính xác lên đến 30%

VietNamNet 15 giờ trước

GoChek đồng hành cùng TikTok Awards: Nơi đam mê sáng tạo lên ngôi

Trong thời đại mà giọng nói trở thành dấu ấn cá nhân của người sáng tạo, âm thanh không chỉ để nghe mà là cách để cảm

VietNamNet 16 giờ trước

Meta bị cáo buộc thu hàng tỷ USD từ quảng cáo lừa đảo

Truyền thông Mỹ vừa công bố một loạt tài liệu nội bộ của Meta, cáo buộc tập đoàn công nghệ này kiếm hàng tỷ USD mỗi n

VietNamNet 16 giờ trước

Những học sinh 'đánh bại' AI ở kỳ thi Toán học khó nhất hành tinh

Tin liên quan

Tin nổi bật