Nhảy đến nội dung

Kỹ sư trẻ dùng AI thay đổi cách gõ tiếng Việt

Bộ gõ tiếng Việt tích hợp AI là một trong những sản phẩm kết hợp thành công sự sáng tạo với kiến thức chuyên môn, nhằm mang lại giá trị thực tiễn cho cộng đồng.

Giao diện của v7, bộ gõ tích hợp AI. Ảnh: NVCC.

Chia sẻ với Tri Thức - Znews, Trí Đức (sinh năm 2003) kể về ý tưởng ứng dụng trí tuệ nhân tạo để thay đổi cách thức nhập liệu tiếng Việt. Bộ gõ v7, dự án của cậu sinh viên nay đã phát triển thành một bài nghiên cứu và được chấp nhận tại IJCAI 2025, một hội nghị danh giá về AI.

Dù phổ biến suốt nhiều thập kỷ, bộ gõ Telex hay VNI vẫn còn nhiều hạn chế trong trải nghiệm người dùng. Từ đó, v7 ra đời nhằm trở thành công cụ dự đoán gọn nhẹ, giúp rút ngắn thời gian gõ tiếng Việt nhờ tích hợp AI.

Niềm say mê ngôn ngữ và công nghệ

Niềm yêu thích ngôn ngữ và công nghệ đã đưa Đức đến với chuyên ngành Trí tuệ nhân tạo ứng dụng tại Đại học Bách khoa TP.HCM.

Trong quá trình học, bạn tiếp cận các dự án như mô hình ngôn ngữ lớn (LLM) cho tiếng Việt, phần mềm dịch tiếng dân tộc thiểu số, hay chatbot hỗ trợ tuyển sinh. “Chính những trải nghiệm đó đã giúp mình tích lũy kiến thức nền tảng vững chắc, nuôi dưỡng đam mê và khát khao ứng dụng AI để tạo ra các sản phẩm có ích cho cộng đồng”, cậu bạn chia sẻ.

Bo go tich hop AI anh 1

Trí Đức mong muốn mang lại giá trị từ việc ứng dụng AI vào đời sống. Ảnh: NVCC.

Ngoài ra, với nền tảng tiếng Trung phổ thông và tiếng Quảng Đông, Đức nhận ra sự tương quan của pinyin/jyutping với chính tả tiếng Việt. Yếu tố này cũng khiến bạn thấy rằng trái ngược với sự phức tạp của chữ tượng hình, bộ gõ pinyin của Trung Quốc chỉ cần nhập “y n” là ra tên nước ta trong Hán tự. Trong khi Telex hay VNI cần đến 10 phím để ra chữ “Việt Nam”.

Với quan sát của mình, Đức nhận ra khi trao đổi nhanh, người dùng thường viết tắt bằng cách giữ lại phụ âm đầu, như “hs” cho “học sinh”. “Nếu con người có thể dễ dàng hiểu kiểu viết này, AI hoàn toàn có thể hiểu được nếu được huấn luyện với dữ liệu phù hợp”, cậu cho biết về hoàn cảnh nảy sinh ý tưởng.

Thay vì phải viết đầy đủ ký tự rồi mới bỏ dấu khi sử dụng các bộ gõ truyền thống như Telex hay VNI vốn theo cơ chế bổ sung, v7 dùng AI gợi ý từ mình muốn viết. Công nghệ sẽ dự đoán chính xác từ hoàn chỉnh với ít phím nhất có thể.

Trong cấu trúc chính tả tiếng Việt, một từ bao gồm phụ âm đầu, vần và thanh điệu. Ví dụ, từ “Nguyễn” được cấu tạo bởi “ng”, “uyên”, và thanh ngã. Dựa trên nguyên lý này, bộ gõ v7 được xây dựng để dự đoán từ đầy đủ chỉ với phụ âm đầu và thanh điệu, giúp giảm đáng kể số lần gõ phím mà vẫn giữ được tính chính xác.

Thử thách dạy tiếng Việt cho AI

Theo Đức, khó khăn lớn nhất là dạy cho AI "hiểu" được tiếng Việt để phục vụ cho bộ gõ này. Cậu bạn đã thử qua rất nhiều mô hình trước khi lựa chọn GPT-2 làm nền móng, với kiến trúc Transformers cho khả năng hiểu ngữ cảnh tốt và dự đoán từ chính xác.

Sau khi lựa chọn kiến trúc nền, Đức đã thay thế hoàn toàn Tokenizer (bộ mã hóa từ vựng) bằng bộ từ vựng tiếng Việt do chính mình xây dựng. Chàng kỹ sư đã lọc ra để đưa vào tất cả những từ tiếng Việt hợp lệ, đúng chính tả để đảm bảo khả năng xử lý toàn diện, dự đoán bất cứ từ gì người dùng muốn viết.

Một khó khăn khác nằm ở việc cân bằng giữa hiệu suất dự đoán và tốc độ phản hồi, nhằm đảm bảo mô hình có thể chạy thời gian thực trên cả máy tính lẫn điện thoại nhưng vẫn đủ mạnh để đưa ra dự đoán tốt nhất. Sau 2 tháng thử nghiệm liên tục, phiên bản hiện tại đã đưa đúng đến gần 70% từ mà người dùng muốn nhập lên đầu, với độ trễ chỉ 0.03 giây.

Về quy cách nhập của bộ gõ, theo nhiều nghiên cứu mà Đức tham khảo từ các nhà ngữ học Cao Xuân Hạo hay Henri Maspero, tiếng Việt không phải chỉ có 6, mà đến 8 thanh điệu. Để tận dụng đặc trưng này, v7 sử dụng hệ 8 thanh điệu thay cho 6 như thông thường (bao gồm một thanh ngang và 5 thanh có dấu: sắc, huyền, hỏi, ngã, nặng). Trong bộ gõ này, khi nhập “v7”, mô hình sẽ gợi ý chữ “Việt”. Đây cũng là ý tưởng cho tên gọi sản phẩm.

Sau khi chia sẻ v7 lên mạng xã hội của mình, Đức kể rằng bản thân rất vui và bất ngờ khi mô hình nhận được sự quan tâm, ủng hộ và mong muốn trải nghiệm. “Điều đó cho mình cảm giác rõ ràng về nhu cầu của một bộ gõ tiếng Việt thông minh và nhanh hơn”, cậu bạn cho biết.

Bo go tich hop AI anh 2

Nhóm tác giả của bài báo nghiên cứu khoa học. Từ trái qua: Nhật Khang, Hiếu Nghĩa, và Trí Đức. Ảnh: NVCC.

Hiện bộ gõ vẫn đang ở giai đoạn mẫu thử (prototype), với mã nguồn mở trên GitHub để lập trình viên hay người dùng công nghệ có thể thử nghiệm và đóng góp. Phiên bản ứng dụng hoàn chỉnh cho Windows và macOS cũng đang được phát triển cho tệp người dùng phổ thông dễ dàng cài đặt và sử dụng.

Trong tương lai, ưu tiên hàng đầu cho v7 là phiên bản bàn phím trên iPhone, nhằm cải tiến cách nhập văn bản tiếng Việt bằng điện thoại thông minh. Ngoài ra, mô hình sẽ được cải thiện độ chính xác bằng cách huấn luyện thêm trên dữ liệu hội thoại thường ngày, giúp AI hiểu tốt hơn các ngữ cảnh thông dụng.

Hành trình của Đức đã góp phần thổi một làn gió sáng tạo, bắt kịp xu hướng công nghệ trong bối cảnh Việt Nam đang đầu tư mạnh vào hạ tầng AI. Một khoảnh khắc khiến cậu tự hào là khi v7 lần đầu tạo được một câu hoàn chỉnh. "Đó là khi một mô hình nhỏ chắc chỉ bằng 1/10000 ChatGPT hiện nay, vẫn có thể nghĩ giống như con người”, Đức nói.

Những nhà khoa học tiên phong

"Những nhà khoa học tiên phong" là một cuốn sách thú vị về lịch sử của những phát minh nổi tiếng. Để có được những đóng góp vĩ đại cho nhân loại, các nhà khoa học nổi tiếng đã làm việc với lòng say mê và tinh thần học hỏi không ngừng.