Nhảy đến nội dung
 

DeepSeek ra mô hình AI 'giảm nửa chi phí khi suy luận'

Công bố trên nền tảng Hugging Face và GitHub ngày 29/9, V3.2-exp tích hợp các tính năng giúp giảm chi phí suy luận. Mô hình hiện trong quá trình thử nghiệm cuối và sẽ triển khai dưới dạng API (giao diện lập trình ứng dụng) cho các nhà phát triển thời gian tới.

Trong đó, quan trọng nhất là DeepSeek Sparse Attention, một hệ thống phức tạp sử dụng module riêng với nhiệm vụ ưu tiên các đoạn trích cụ thể từ cửa sổ ngữ cảnh. Một hệ thống có tên "fine-grained token selection", tức làm nhiệm vụ lựa chọn mã thông báo (token) cụ thể từ các đoạn trích, tải vào "cửa sổ Attention" của module theo trình tự hạn chế nhằm tiết kiệm tài nguyên. Kết quả là Sparse Attention có thể xử lý chuỗi ngữ cảnh dài với máy chủ tương đối nhỏ.

Với việc xử lý ngữ cảnh dài, lợi ích của Sparse Attention được đánh giá rất đáng kể. Thử nghiệm sơ bộ của DeepSeek cho thấy chi phí của một lệnh gọi API đơn giản có thể giảm một nửa với loại ngữ cảnh này. Dù vậy, công ty cho biết có thể cần thử nghiệm thêm và đánh giá chi tiết trước khi có bản hoàn thiện cho người dùng cuối.

Theo TechCrunch, V3.2-exp có thể là giải pháp đột phá liên quan đến khả năng suy luận hiệu năng cao với chi phí thấp của AI - vấn đề hiện nhận sự quan tâm lớn trong bối cảnh nhiều công ty đổ xô xây dựng hạ tầng phục vụ huấn luyện các mô hình trí tuệ nhân tạo. DeepSeek nổi tiếng với mô hình AI hiệu năng cao với chi phí thấp, và V3.2-exp được coi là cải tiến lớn so với trước đó.

Có trụ sở tại Trung Quốc, DeepSeek từng gây sốt hồi đầu năm với mô hình V3 và R1. Thời gian qua, công ty ủng hộ phương pháp "chưng cất" vì giúp mô hình đạt hiệu suất tốt trong khi chi phí đào tạo và vận hành rẻ hơn nhiều, cho phép các công nghệ AI tiếp cận rộng rãi hơn, theo Reuters. Tuy vậy, những mô hình kiểu này không tạo ra cuộc cách mạng toàn diện trong đào tạo AI như dự đoán, khiến công ty dần mất sự chú ý trong những tháng sau đó.

Bảo Lâm - Huy Đức (theo TechCrunch, Reuters)

 
 
 
CÔNG TY CỔ PHẦN XÂY DỰNG SẢN XUẤT VÀ THƯƠNG MẠI ĐẠI SÀN
logo

Giấp phép đăng ký kinh doanh số 0103884103 do Sở Kế Hoạch & Đầu Tư Hà Nội cấp lần đầu ngày 29/06/2009.

Trụ sở chính: Gian số L4-07 tầng 4, nơ-2 - Gold Season, 47 Nguyễn Tuân, Thanh Xuân, Hà Nội

Email: daisanjsc@gmail.com

TRỤ SỞ HÀ NỘI

Địa chỉ Gian số L4-07 tầng 4, nơ-2 - Gold Season, 47 Nguyễn Tuân, Thanh Xuân, Hà Nội

Điện thoại  Điện thoại: 1900 98 98 36

Fax  Fax: 045625169

CHI NHÁNH HỒ CHÍ MINH

Địa chỉ 57/1c, Khu phố 1, Phường An Phú Đông, Quận 12, Thành phố Hồ Chí Minh

Điện thoại  Email: info@daisan.vn