DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50%

Công ty công nghệ DeepSeek (Trung Quốc) vừa giới thiệu mô hình AI thử nghiệm V3.2-Exp, hướng đến khả năng xử lý văn bản dài hiệu quả hơn và cắt giảm đáng kể chi phí vận hành.
Ngày 29-9, Công ty công nghệ DeepSeek (Trung Quốc) công bố mô hình trí tuệ nhân tạo thử nghiệm mới mang tên DeepSeek-V3.2-Exp.
Sản phẩm này dù không tạo hiệu ứng truyền thông mạnh như các phiên bản V3 hay R1 trước đó, song vẫn được nhiều chuyên gia đánh giá là một bước đi chiến lược khi tập trung phát triển khả năng xử lý văn bản dài và giảm chi phí tính toán.
Tăng tốc suy luận, tiết kiệm tài nguyên
DeepSeek mô tả V3.2-Exp là một "bước trung gian hướng tới kiến trúc thế hệ mới", cho thấy đây không chỉ là bản thử nghiệm tạm thời mà là nền tảng cho những phiên bản đột phá hơn trong tương lai.
Trước đó, hai mô hình DeepSeek-V3 và DeepSeek-R1 từng gây chú ý tại thị trường Mỹ nhờ khả năng tối ưu tài nguyên và hiệu suất huấn luyện với chi phí thấp.
Điểm đáng chú ý nhất của V3.2-Exp là cơ chế DeepSeek Sparse Attention. Thay vì xử lý toàn bộ dữ liệu đầu vào một cách đồng đều, mô hình mới này có khả năng lựa chọn vùng thông tin cần tập trung để giảm tải tính toán. Cách tiếp cận này giúp thu gọn lượng tham số kích hoạt trong quá trình huấn luyện, tiết kiệm tài nguyên GPU và tăng tốc suy luận ở các tác vụ quy mô lớn.
Giới phân tích nhận định mô hình này khó tạo ra cú hích lập tức như các bản phát hành hồi đầu năm, song khả năng duy trì hiệu quả với chi phí thấp có thể giúp DeepSeek gia tăng sức cạnh tranh với các tên tuổi lớn như OpenAI, Alibaba hay Baidu, nhất là trong nhóm khách hàng doanh nghiệp sử dụng API ở quy mô lớn.
Theo công bố của DeepSeek, giá API của V3.2-Exp "được cho là" thấp hơn 50% so với trước đây, tuy nhiên công ty chưa công bố chi tiết bảng giá để đối chiếu. Động thái này cho thấy DeepSeek đang tập trung vào hiệu quả vận hành thay vì chỉ dựa trên quy mô tham số.
Chiến lược dài hơi hay phép thử thị trường?
Thời điểm ra mắt V3.2-Exp trùng với giai đoạn các tập đoàn về công nghệ đang tăng tốc phát triển mô hình thế hệ mới.
OpenAI được cho là đang chuẩn bị giới thiệu bản kế nhiệm GPT-4; Alibaba mở rộng hệ sinh thái Qwen; Baidu và Tencent tiếp tục đẩy mạnh tích hợp AI vào nền tảng dịch vụ sẵn có.
Các công ty như Anthropic, Cohere hay xAI cũng liên tục cải tiến mô hình để tranh giành thị phần. Trong bối cảnh đó, lợi thế kết hợp giữa hiệu năng và chi phí thấp có thể giúp DeepSeek định vị ở nhóm doanh nghiệp vừa và nhỏ, nơi yếu tố giá thành mang tính quyết định.
Theo giới chuyên môn, khả năng xử lý chuỗi văn bản dài của V3.2-Exp phù hợp với các ứng dụng trong môi trường doanh nghiệp và ngành dịch vụ: trợ lý số đọc hiểu tài liệu nội bộ, hỗ trợ lập trình với ngữ cảnh mã nguồn phức tạp, phân tích dữ liệu chuyên ngành như pháp lý hoặc tài chính, vận hành chatbot có khả năng duy trì hội thoại dài, hay tạo nội dung dạng dài với độ nhất quán cao.
Nếu cơ chế Sparse Attention đạt hiệu quả thực tế như kỳ vọng, hướng tiếp cận này có thể trở thành lựa chọn mới thay cho việc tăng số tham số mô hình một cách tuyến tính.
Việc DeepSeek gọi V3.2-Exp là 'bước trung gian' cho thấy công ty đang chủ động thử nghiệm kiến trúc mới, thu thập phản hồi và tiếp tục đầu tư vào hoạt động nghiên cứu và phát triển (R&D) trước khi tung ra phiên bản hoàn thiện hơn. Hiện chưa có lịch trình cụ thể cho bản nâng cấp tiếp theo, nhưng động thái này cho thấy DeepSeek đang theo đuổi chiến lược dài hạn thay vì chỉ chạy theo truyền thông.