Nhảy đến nội dung
 

DeepSeek phát triển mô hình có khả năng tự kiểm chứng các suy luận trong toán học

DeepSeek ra mắt mô hình DeepSeekMath-V2 là một sự kiện mang tính bước ngoặt, không chỉ đơn thuần là việc tạo ra một AI giải toán giỏi hơn.

DeepSeekMath-V2 đã thiết lập các kỷ lục hiệu suất chưa từng có, vượt qua cả thành tích của con người trong các cuộc thi hàn lâm khốc liệt. Điển hình, mô hình đạt mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và gây chấn động với số điểm 118/120 tại kỳ thi Putnam, vượt xa kỷ lục 90 điểm cao nhất từng được con người đạt tới.

Tuy nhiên điều làm nên sự đột phá thực sự của mô hình này không phải là điểm số, mà là tính năng "tự kiểm chứng" của DeepSeek.

Cơ chế tự kiểm chứng và sửa lỗi của DeepSeek

Trong nhiều năm, các mô hình trí tuệ nhân tạo (AI) và mô hình ngôn ngữ lớn (LLMs) phải đối mặt với một điểm yếu nghiêm trọng khi giải quyết các vấn đề đòi hỏi tính logic tuyệt đối như toán học, đó là hiện tượng "lập luận sai mà đáp án đúng". 

Tức là mô hình có thể tình cờ đưa ra câu trả lời cuối cùng chính xác, nhưng chuỗi các bước suy luận, các công thức hay các bước logic dẫn đến kết quả đó lại bị sai, thiếu sót hoặc bịa đặt (hallucinate). 

Trong lĩnh vực khoa học, kỹ thuật và toán học, một câu trả lời đúng với một lời giải sai hoàn toàn không có giá trị và làm giảm đáng kể độ tin cậy của hệ thống AI. DeepSeekMath-V2 được tạo ra để chấm dứt kỷ nguyên của sự thiếu tin cậy này.

Khả năng tự kiểm chứng của DeepSeekMath-V2 là cốt lõi của sự thành công. Nó hoạt động như một "kiểm toán viên nội bộ" trong quá trình tư duy của AI. Thay vì chỉ suy luận một lần và đưa ra câu trả lời, mô hình DeepSeekMath-V2 tích hợp một cơ chế hai chiều.

Đầu tiên là vai trò chứng minh, khi mô hình tạo ra chuỗi lập luận và lời giải ban đầu. Sau đó mô hình tự động kích hoạt một hệ thống kiểm tra nội bộ, rà soát lại từng bước logic của chuỗi lập luận vừa tạo ra để tìm kiếm lỗi, sự mâu thuẫn hoặc các bước nhảy vọt không hợp lý.

Quá trình này rất giống với cách hệ thống đánh giá IMO-ProofBench hoạt động, nơi một AI tạo lập luận và một AI khác kiểm chứng. Bằng cách lặp lại việc kiểm tra chéo này đến khi chuỗi lập luận được xác nhận là hoàn toàn chặt chẽ, DeepSeekMath-V2 đảm bảo rằng không chỉ câu trả lời đúng, mà con đường dẫn đến câu trả lời đó cũng phải tuyệt đối chính xác và minh bạch.

Mở ra tương lai của AI đáng tin cậy

Ý nghĩa của phương pháp suy luận tự kiểm chứng này có thể thiết lập một tiêu chuẩn mới về tính minh bạch và độ tin cậy cho các ứng dụng AI trong thế giới thực. 

Trong tương lai, mô hình này có thể được ứng dụng trong các lĩnh vực trọng yếu khác như: AI không chỉ viết code mà còn tự kiểm tra và chứng minh tính đúng đắn, giảm thiểu lỗi nghiêm trọng.

Ngoài ra, AI có thể tự động kiểm chứng các chuỗi lý luận phức tạp khi phát triển giả thuyết hoặc chứng minh các định lý mới. Từ đó đảm bảo tính hợp lý và an toàn của các quyết định quan trọng do AI đưa ra.

Việc DeepSeek quyết định công khai mã nguồn của mô hình trên các nền tảng như Hugging Face và GitHub là một động thái chiến lược, cho phép cộng đồng nghiên cứu toàn cầu tiếp cận và xây dựng dựa trên nguyên tắc suy luận có kiểm chứng này.

 
 
 
CÔNG TY CỔ PHẦN DAISAN GROUP
logo

Giấp phép đăng ký kinh doanh số 0108016125 do Sở Kế Hoạch & Đầu Tư Hà Nội cấp lần đầu ngày 10/10/2017.

Địa chỉ ĐKKD: Phòng 600, Tầng 6, Tòa nhà Ford Thăng Long, Số 105 Láng Hạ, Phường Đống Đa, TP Hà Nội, Việt Nam

Email: info@daisan.vn

TRỤ SỞ HÀ NỘI

Địa chỉ 47 Nguyễn Tuân, Phường Thanh Xuân, Thành phố Hà Nội, Việt Nam.

Điện thoại  Điện thoại: 1900 98 98 36

Fax  Fax: 045625169

CHI NHÁNH HỒ CHÍ MINH

Địa chỉ 57/1c, Khu phố 1, Phường An Phú Đông, Quận 12, Thành phố Hồ Chí Minh

Điện thoại  Email: info@daisan.vn