Mỹ thắng tuyệt đối tại giải cờ vua dành cho AI

Sáng 6-8, ngày khai mạc giải đấu cờ vua dành cho AI đã diễn ra và chứng kiến màn hủy diệt của bốn mô hình ngôn ngữ lớn (LLM) từ Mỹ khi đánh bại Trung Quốc với chiến thắng tuyệt đối 4-0.
Với chiến thắng tuyệt đối 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 và o3 đã xuất sắc tiến thẳng vào bán kết tại giải đấu cờ vua dành cho AI, sau khi đánh bại lần lượt Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash và Kimi k2.
Trong trận tứ kết đáng chú ý nhất, mô hình Kimi K2 của Công ty Moonshot AI (Trung Quốc) đã chịu thất bại thảm hại 0-4 trước o3, LLM của OpenAI - nhà phát triển ChatGPT.
Toàn bộ bốn ván đấu đều kết thúc chóng vánh trong vòng chưa đầy 8 nước đi, khi Kimi K2 liên tục đi những nước cờ không hợp lệ.
Đơn cử, ở ván thứ ba, dù nhận thức đúng về thế cờ khi o3 chiếu hậu, Kimi K2 vẫn không thể tìm ra một nước đi đúng luật nào trong cả bốn lần thử, và buộc phải chịu thua. Tỉ lệ nước đi trùng với công cụ Stockfish của o3 lên tới 100%, cho thấy sự chênh lệch trình độ là quá lớn.
Đại diện còn lại của Trung Quốc, DeepSeek, cũng không khá hơn khi thua 0-4 trước o4-mini của OpenAI. Dù làm tốt hơn đồng hương khi cầm cự được ở ván đầu, DeepSeek vẫn mắc sai lầm và bị chiếu hết ở những ván sau.
Tuy nhiên, nhân vật gây ấn tượng mạnh nhất vòng tứ kết lại là Grok 4, mô hình từ Công ty xAI của tỉ phú Elon Musk. Grok 4 đã dễ dàng đánh bại Gemini 2.5 Flash của Google với tỉ số 4-0. Với khả năng trừng phạt mọi sai lầm của đối thủ, tỉ lệ nước đi chính xác của Grok 4 đã đạt mức cao nhất vòng đấu, xấp xỉ 97,5%.
Bình luận về ván đấu, kỳ thủ số 2 thế giới Hikaru Nakamura không khỏi kinh ngạc: “Chắc chắn Grok 4 là LLM đánh cờ mạnh nhất giải này. Chênh lệch trình độ giữa nó và các mô hình khác không nhỏ đâu”.
Lời nhận xét này càng được củng cố khi ông Musk nhanh chóng chia sẻ lại hình ảnh bình luận của Nakamura trên mạng xã hội X, kèm theo lời bình đầy tự tin: “Đây mới chỉ là tác dụng phụ thôi. xAI gần như không dành chút thời gian nào cho cờ vua”.
Về phía Google, dù Gemini 2.5 Flash đã bị loại nhưng đại diện còn lại của họ là Gemini 2.5 Pro đã có chiến thắng thuyết phục 4-0 trước Claude 4 Opus của Công ty Anthropic, khẳng định vị thế của mình tại giải đấu.
Vòng bán kết sẽ diễn ra vào 0h30 ngày 7-8 (giờ Việt Nam). Trận bán kết đầu tiên là cuộc đối đầu đỉnh cao giữa Grok 4 và Gemini 2.5 Pro. Trận đấu còn lại là một trận "derby OpenAI" đầy kịch tính giữa o3 và o4-mini.