CodeSteer- huấn luyện viên AI giúp mô hình ngôn ngữ ‘biết khi nào nên lập trình’

Hệ thống CodeSteer có thể nâng cao độ chính xác của các mô hình ngôn ngữ lớn trong việc giải quyết các bài toán phức tạp, chẳng hạn như lập lịch vận chuyển trong chuỗi cung ứng.

Các mô hình ngôn ngữ lớn (LLM) rất giỏi sử dụng lập luận văn bản để hiểu bối cảnh của một tài liệu và đưa ra câu trả lời hợp lý. Tuy nhiên, chính những mô hình này lại thường gặp khó khăn khi phải giải các bài toán đơn giản nhất.

Việc sử dụng văn bản để xử lý các nhiệm vụ tính toán hay thuật toán thường không phải là cách lý tưởng. Mặc dù một số LLM có thể sinh mã lệnh (như Python) để xử lý các truy vấn mang tính biểu tượng (symbolic), nhưng các mô hình lại không luôn biết khi nào cần dùng code, hoặc nên dùng loại code nào là phù hợp.

Có vẻ như LLM cần một “huấn luyện viên” để định hướng cách tiếp cận hiệu quả nhất.

CodeSteer - trợ lý thông minh giúp LLM điều hướng giữa mã lệnh và văn bản

CodeSteer là một LLM nhỏ hơn, được các nhà nghiên cứu tại MIT phát triển để hướng dẫn một LLM lớn hơn chuyển đổi linh hoạt giữa việc sinh văn bản và sinh mã lệnh cho đến khi có được câu trả lời chính xác.

CodeSteer sẽ tự động tạo ra một loạt các prompt (hướng dẫn) để điều hướng LLM lớn hơn. Nó sẽ xem xét các câu trả lời hiện tại và trước đó của mô hình sau mỗi vòng và cung cấp hướng dẫn để sửa hoặc tinh chỉnh cho đến khi đạt kết quả đúng.

Các nhà nghiên cứu phát hiện rằng, khi tích hợp CodeSteer, độ chính xác của LLM lớn trong các tác vụ biểu tượng (như nhân số, chơi Sudoku, xếp khối) được cải thiện hơn 30%. Hơn nữa, nó còn giúp các mô hình đơn giản hơn có thể vượt qua cả những mô hình tiên tiến trong các bài toán cần tư duy nâng cao.

Huấn luyện viên cho LLM - không cần can thiệp vào mô hình chính

Ví dụ, nếu bạn hỏi LLM: “Số nào lớn hơn, 9.11 hay 9.9?”, nó có thể trả lời sai do dùng lập luận văn bản. Nhưng nếu bạn yêu cầu nó viết mã Python để so sánh hai số này, mô hình có thể dễ dàng giải quyết bằng cách thực thi đoạn mã.

Mặc dù đã được tinh chỉnh để tạo code, LLM vẫn thường chọn đoạn code sai hoặc kém hiệu quả. Thay vì huấn luyện lại một mô hình lớn như GPT-4 hay Claude, các nhà nghiên cứu tại MIT lại tinh chỉnh một mô hình nhỏ hơn để hướng dẫn mô hình lớn.

“Giống như trong thể thao - huấn luyện viên không nhất thiết giỏi hơn vận động viên, nhưng vẫn đưa ra lời khuyên hữu ích. Với LLM cũng vậy”, Yongchao Chen, nghiên cứu sinh tại MIT nói.

CodeSteer hoạt động như một huấn luyện viên: nó đọc câu hỏi, xác định nên dùng văn bản hay mã lệnh, và loại mã nào là phù hợp. Sau đó, nó tạo prompt để LLM lớn trả lời. Nếu câu trả lời sai, CodeSteer tiếp tục gợi ý cách cải thiện - như thêm thuật toán tìm kiếm hoặc điều kiện ràng buộc vào đoạn mã - cho đến khi mô hình trả lời đúng.

CodeSteer còn có cơ chế kiểm tra độ phức tạp của mã lệnh, tránh việc mô hình “lười” dùng đoạn mã đơn giản không đủ chính xác. Ngoài ra, nó có khả năng tự xác thực kết quả bằng cách yêu cầu LLM viết code để kiểm tra lại đáp án.

Tạo bộ dữ liệu riêng cho bài toán phức tạp

Do thiếu bộ dữ liệu phù hợp để kiểm tra và huấn luyện, nhóm nghiên cứu đã tự xây dựng bộ SymBench gồm 37 nhiệm vụ biểu tượng phức tạp: tư duy không gian, toán học, logic thứ tự, tối ưu hóa…

Kết quả cho thấy, CodeSteer giúp tăng độ chính xác trung bình từ 53.3% lên 86.4%, vượt qua tất cả 9 phương pháp tham chiếu khác.

Hơn nữa, một mô hình LLM thông thường được hỗ trợ bởi CodeSteer thậm chí vượt qua các mô hình hiện đại chuyên biệt hóa cho bài toán lập luận phức tạp - nhưng lại tiêu tốn ít tài nguyên tính toán hơn đáng kể.

“Phương pháp này tận dụng chính năng lực sẵn có của LLM, chỉ cần thêm khả năng dùng mã lệnh thông minh là hiệu quả đã tăng vượt bậc”, Yongchao Chen cho biết thêm.

Tương lai: LLM tự điều hướng mà không cần trợ lý tách rời

Trong tương lai, nhóm nghiên cứu muốn cải thiện tốc độ lặp lại của CodeSteer và khám phá việc huấn luyện một mô hình thống nhất - có thể tự chuyển đổi giữa tư duy văn bản và sinh mã lệnh, thay vì dựa vào một mô hình phụ.

“Đây là giải pháp gọn gàng cho thách thức lớn của LLM hiện nay: cách sử dụng đúng công cụ đúng lúc”, Jinsung Yoon - nghiên cứu viên tại Google Cloud AI nhận định.

“Việc đào tạo một mô hình nhỏ để dẫn dắt một mô hình lớn là hướng đi rất tiềm năng, đặc biệt trong các ứng dụng thực tế phức tạp”, Chi Wang, nghiên cứu viên cấp cao tại Google DeepMind nói.

Nghiên cứu này được hỗ trợ bởi Văn phòng Nghiên cứu Hải quân Hoa Kỳ và Phòng Thí nghiệm AI MIT-IBM Watson.

(Theo MIT)

Nguồn VietNamNet: https://vietnamnet.vn/codesteer-huan-luyen-vien-ai-giup-mo-hinh-ngon-ngu-biet-khi-nao-nen-lap-trinh-2425386.html

CodeSteer

Tin liên quan

Điểm chuẩn B00, C00 Trường ĐH Y Hà Nội chênh nhau 5 điểm

Trường ĐH Y Hà Nội đã đưa ra nguyên tắc xác định điểm chuẩn với những ngành cùng xét nhiều tổ hợp, điểm chuẩn B00, C0

Thanh Niên 3 giờ trước

Sinh viên ĐH Quốc gia TP.HCM được vay 50 triệu đồng/năm không cần chứng minh thu nhập

Sinh viên ĐH Quốc gia TP.HCM có thể được vay tối đa 50 triệu đồng cho mỗi năm học mà không cần chứng minh thu nhập.

Thanh Niên 4 giờ trước

DOL English đồng hành cùng thủ khoa khối B Trần Đức Tài

Cụ thể, tại chương trình livestream ‘Cùng thủ khoa mở khóa chọn trường’ chiều 24-7 của báo Tiền Phong, hệ thống Anh n

Tiền Phong 5 giờ trước

Cô học trò Vân Kiều ngượng nghịu đọc ‘thư cảm ơn' vì sắp có 'Ngôi nhà hạnh phúc'

Sáng 25.7, Trung ương Đoàn tổ chức lễ khởi công xây dựng công trình “Ngôi nhà hạnh phúc” cho em Hồ Thị Ánh Tuyết, học

Thanh Niên 6 giờ trước

Cà Mau: 8 nguyên giám đốc, phó giám đốc sở ‘có liên quan’ nghe công bố kết luận tố cáo của giáo viên

Liên quan nội dung tố cáo của một giáo viên ở Bạc Liêu, Sở Giáo dục và Đào tạo tỉnh Cà Mau mời 8 nguyên giám đốc, phó

Tuổi Trẻ 6 giờ trước

Sinh viên Đại học Quốc gia TP.HCM có thể vay 50 triệu đồng/năm học lãi suất 2%

Đại học Quốc gia TP.HCM và Ngân hàng ACB triển khai gói tín dụng 50 tỉ đồng hỗ trợ sinh viên vay nộp học phí, với lãi

Tuổi Trẻ 6 giờ trước

Đại học sẽ gặp khó với bách phân vị nếu thiếu dữ liệu

Sau khi công bố

Life Style 6 giờ trước

Thủ khoa tốt nghiệp THPT tỉnh Gia Lai với ước mơ trở thành giáo viên toán

Với tổng điểm 29,5/40 và điểm cao nhất tổ hợp A00 toàn tỉnh, Phan Trịnh Nguyên, học sinh Trường THPT Chi Lăng, đã đoạ

Thanh Niên 7 giờ trước

Chương trình 'Mizuiku – Em yêu nước sạch' chính thức phát động cuộc thi 'Bảo tồn nguồn nước – Nuôi dưỡng tương lai'

Kỷ niệm hành trình 10 năm nâng cao nhận thức về bảo vệ tài nguyên nước cho thế hệ trẻ Việt Nam, chương trình “Mizuiku

Tiền Phong 9 giờ trước

Điểm sàn Trường ĐH Sư phạm kỹ thuật TP.HCM nhiều ngành ở mức 15

Trường ĐH Sư phạm kỹ thuật TP.HCM vừa công bố điểm sàn xét tuyển và quy đổi điểm tương đương giữa các phương thức, tổ

Thanh Niên 10 giờ trước

Điểm sàn Trường ĐH Sư phạm kỹ thuật TP.HCM nhiều ngành ở mức 15

Trường ĐH Sư phạm kỹ thuật TP.HCM vừa công bố điểm sàn xét tuyển và quy đổi điểm tương đương giữa các phương thức, tổ

Thanh Niên 10 giờ trước

Những ngày cuối đăng ký xét tuyển: Tránh tình huống 'sai một li, đi một dặm'

Theo các chuyên gia tuyển sinh, những năm qua, nhiều thí sinh mắc những 'sai lầm' trong quá trình đăng ký xét tuyển Đ

Thanh Niên 10 giờ trước

Những ngày cuối đăng ký xét tuyển: Tránh tình huống 'sai một li, đi một dặm'

Theo các chuyên gia tuyển sinh, những năm qua, nhiều thí sinh mắc những 'sai lầm' trong quá trình đăng ký xét tuyển Đ

Thanh Niên 10 giờ trước

Thí sinh tá hỏa khi ‘trắng’ chứng chỉ ngoại ngữ ở phiếu nguyện vọng xét đại học

Nhiều phụ huynh bày tỏ lo lắng, thấp thỏm liệu có được đảm bảo quyền lợi vì đã tải chứng chỉ ngoại ngữ lên Hệ thống đ

VietNamNet 11 giờ trước

Một trường đại học có 2 hiệu trưởng

Life Style 11 giờ trước

CodeSteer- huấn luyện viên AI giúp mô hình ngôn ngữ ‘biết khi nào nên lập trình’

Tin liên quan

Tin nổi bật