Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập

Mô hình ngôn ngữ lớn (LLM) do người Việt phát triển triển khai loạt ứng dụng hữu ích phục vụ nhu cầu tra cứu thông tin, giao tiếp của người dùng, ghi nhận hàng triệu lượt truy cập.

Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập

Được phát triển bởi đội ngũ kỹ sư người Việt của Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đang mang tới loạt ứng dụng thực tế thu hút đông đảo người dùng truy cập và sử dụng hàng tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên Zalo, cung cấp bộ 3 tính năng gồm Hỏi đáp các chủ đề khác nhau như khoa học, lịch sử, luật giao thông…; Sáng tạo nội dung như viết văn, soạn email, tin đăng mạng xã hội…; và Giải trí bằng cách đưa ra các gợi ý về địa điểm du lịch, âm nhạc, sách…

Thống kê của đội ngũ phát triển cho thấy trợ lý này đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong gần 2 tháng.

Kiki Info tích hợp trên nền tảng nhắn tin Zalo.

Một ứng dụng khác cũng do mô hình ngôn ngữ lớn của Zalo phát triển là thiệp AI, hiện đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Đây là số liệu được tổng hợp trong vòng 2 tháng, người dùng sử dụng thiệp AI để trao gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.

Các ứng dụng đều đang được người dùng đánh giá cao bởi trải nghiệm thông minh, giúp rút ngắn thời gian tìm kiếm và đưa ra quyết định trong cuộc sống. Đồng thời giúp việc kết nối với các mối quan hệ trở nên thú vị và gắn kết hơn.

Mô hình LLM của Zalo được phát triển bằng kỹ thuật huấn luyện từ đầu - triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định, giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình.

Kết thúc năm 2024 vừa qua, mô hình LLM của Zalo cán đích ở vị trí Top 2 trên bảng xếp hạng VMLU - Nền tảng đánh giá và xếp hạng năng lực tiếng Việt của các LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). Cụ thể, mô hình ngôn ngữ lớn của Zalo vươn lên vị trí số 2 trên bảng xếp hạng các mô hình được huấn luyện từ đầu, chỉ xếp sau Llama-3-70B của Meta, chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).

Bảng xếp hạng năm 2024 các LLM xây dựng từ đầu với mô hình LLM của Zalo vào Top 2.

Đây là thành công lớn với một mô hình ngôn ngữ lớn do người Việt phát triển, nhất là khi gặp phải không ít hạn chế trong những ngày đầu phát triển. Trong khi các công ty lớn trên thế giới sở hữu hàng nghìn GPU mới nhất từ Nvidia thì tại Việt Nam, thời điểm đó các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.

Đồng thời, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Bên cạnh đó, Việt Nam cũng còn những hạn chế về nguồn lực con người và kinh nghiệm huấn luyện LLM khi so sánh với các quốc gia phát triển trên thế giới.

Zalo đã có chiến lược phát triển để khắc phục những hạn chế về môi trường huấn luyện so với thế giới. Bằng việc trang bị hạ tầng tính toán với 8 máy chủ DGX H100, mô hình LLM đã được phát triển trực tiếp bằng dòng GPU mới và khan hiếm nhất của Nvidia lúc đó với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second - một petaFLOP tương đương với 10 triệu tỷ phép tính/giây).

Hệ thống máy chủ của Zalo có năng lực xử lý ưu việt.

Đồng thời dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt. Thông qua hàng loạt nghiên cứu thực hiện trên các GPU dân dụng nhỏ, các kỹ sư của Zalo cũng đã tranh thủ trang bị kiến thức và năng lực huấn luyện LLM để tạo dựng nền tảng sẵn sàng ngay khi sở hữu hạ tầng tính toán lớn.

Định hướng phát triển đúng đắn đã giúp Zalo phát triển thành công mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt chỉ sau 6 tháng huấn luyện vào năm 2023, đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn VMLU. Và hiện tại là vượt qua hàng loạt tên tuổi toàn cầu trên bảng xếp hạng VMLU 2024, đồng thời đưa mô hình nghiên cứu vào triển khai trên thực tế cho cộng đồng.

Mô hình LLM của Zalo thi đấu với loạt mô hình trên thế giới như ChatGPT 3.5, ChatGPT 4.0, Llama, PhởGPT và một người chơi thật trong lần đầu ra mắt năm 2023.

Theo Zalo, mô hình LLM sẽ tiếp tục được đầu tư huấn luyện để mang tới nhiều hơn các ứng dụng AI đẳng cấp thế giới cho người dùng. Qua đó, làm chủ công nghệ AI tiên tiến, hướng tới kỷ nguyên phát triển công nghệ của đất nước với định hướng đột phá về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

Nguồn ZNews: https://znews.vn/ung-dung-cua-mo-hinh-ai-viet-dang-thu-hut-hang-trieu-luot-truy-cap-post1563330.html

Zalo

AI Việt

Tin liên quan

AI không tha một ai: Đến các sếp cũng có thể bị ‘hất cẳng’

Cựu lãnh đạo Google cảnh báo trí tuệ nhân tạo (AI) sẽ thay thế hàng loạt việc làm, từ CEO đến lao động phổ thông.

VietNamNet 31 phút trước

Cuối tuần này, xem trận MU - Arsenal ở đâu?

Các đơn vị phát sóng ở Việt Nam chia nhau bản quyền những giải đấu hàng đầu châu Âu.

ZNews 44 phút trước

Video hướng dẫn cách chuyển tài khoản VETC sang tài khoản giao thông nhanh nhất

Việc chuyển tài khoản VETC sang tài khoản giao thông khá dễ dàng với các chủ xe, thực hiện ngay trên smartphone chỉ t

VietNamNet 2 giờ trước

Hệ thống phòng không Skyranger 30: Pháo 30mm bắn 1200 viên/phút, xé nát UAV, tên lửa hành trình ở tầm thấp

Quân đội Đức chuẩn bị chi 6-8 tỷ euro mua 500-600 hệ thống phòng không Skyranger 30 của Rheinmetall.

VietNamNet 2 giờ trước

Phó Chủ tịch Quốc hội gợi mở cách để ‘ngôi nhà’ Quốc hội số sáng đèn mỗi ngày

Phó Chủ tịch Quốc hội Lê Minh Hoan cho rằng chỉ khi cán bộ, công chức thành thạo kỹ năng số để vận hành, ‘ngôi nhà’ Q

VietNamNet 9 giờ trước

An Giang ký kết hợp tác với Viettel xây dựng chính quyền số

Chiều 14-8, UBND tỉnh An Giang và Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) đã ký kết thỏa thuận hợp tác t

Tuổi Trẻ 10 giờ trước

Nhân viên Viettel hối hả lắp trạm 5G phủ sóng toàn bộ sự kiện A80

Với 1.700 trạm phát sóng được lắp mới, mạng 5G Viettel sẽ phủ toàn bộ các địa điểm diễu binh, diễu hành cũng như các

VietNamNet 10 giờ trước

Bắt giữ đối tượng dùng thiết bị BTS giả phát tán tin nhắn lừa đảo tại TP HCM

Cục Tần số vô tuyến điện đã phát hiện và định vị chính xác nguồn phát sóng bất hợp pháp, giúp lực lượng công an bắt q

VietNamNet 11 giờ trước

UAV chữa cháy, mũ đa năng “Made in Việt Nam” tại Triển lãm ở TPHCM

Hơn 400 thiết bị PCCC, cứu hộ và an ninh từ 17 quốc gia được trưng bày tại TPHCM.

VietNamNet 12 giờ trước

Bắt đối tượng lừa đảo với chiêu 'đơn hàng đã ở kho'

Hiện vụ việc đang được tiếp tục mở rộng điều tra, làm rõ các đối tượng liên quan, đặc biệt là những mắt xích trong đư

ZNews 13 giờ trước

Võ Lâm Truyền Kỳ 2.0 được đánh giá mới mẻ, nhịp game nhanh và mượt

Từ lúc mở Alpha Test, ngoại trừ vài phút bảo trì vì server quá tải, cộng đồng game thủ đều công nhận trải nghiệm tron

ZNews 13 giờ trước

Tại diễu binh Quốc khánh 2.9, lần đầu tiên sử dụng AI để giảm nhiễu sóng internet

Trong lễ diễu binh, diễu hành Quốc khánh 2.9, lần đầu tiên, Viettel sử dụng các mô hình AI để dự đoán vị trí đông ngư

Thanh Niên 13 giờ trước

Thị trường máy tính sắp đón làn sóng tích cực

Vòng đời của máy tính xách tay vào khoảng 4-5 năm.

ZNews 13 giờ trước

AI dịch chữ tượng hình Ai Cập cổ đại cho du khách

Chỉ cần một chiếc điện thoại cài ứng dụng Manetho tích hợp AI, du khách sẽ 'đọc' được những chữ tượng hình trên bức t

Tuổi Trẻ 15 giờ trước

iPad Pro lại sắp 'đi trước' MacBook

Dựa trên tin đồn, chip M5 dự kiến tiếp tục xuất hiện đầu tiên trên iPad Pro trước khi được Apple mang lên MacBook Pro

ZNews 16 giờ trước

Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập

Tin liên quan

Tin nổi bật