DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50%

Công ty công nghệ DeepSeek (Trung Quốc) vừa giới thiệu mô hình AI thử nghiệm V3.2-Exp, hướng đến khả năng xử lý văn bản dài hiệu quả hơn và cắt giảm đáng kể chi phí vận hành.

Ngày 29-9, Công ty công nghệ DeepSeek (Trung Quốc) công bố mô hình trí tuệ nhân tạo thử nghiệm mới mang tên DeepSeek-V3.2-Exp.

Sản phẩm này dù không tạo hiệu ứng truyền thông mạnh như các phiên bản V3 hay R1 trước đó, song vẫn được nhiều chuyên gia đánh giá là một bước đi chiến lược khi tập trung phát triển khả năng xử lý văn bản dài và giảm chi phí tính toán.

Tăng tốc suy luận, tiết kiệm tài nguyên

DeepSeek mô tả V3.2-Exp là một "bước trung gian hướng tới kiến trúc thế hệ mới", cho thấy đây không chỉ là bản thử nghiệm tạm thời mà là nền tảng cho những phiên bản đột phá hơn trong tương lai.

Trước đó, hai mô hình DeepSeek-V3 và DeepSeek-R1 từng gây chú ý tại thị trường Mỹ nhờ khả năng tối ưu tài nguyên và hiệu suất huấn luyện với chi phí thấp.

Điểm đáng chú ý nhất của V3.2-Exp là cơ chế DeepSeek Sparse Attention. Thay vì xử lý toàn bộ dữ liệu đầu vào một cách đồng đều, mô hình mới này có khả năng lựa chọn vùng thông tin cần tập trung để giảm tải tính toán. Cách tiếp cận này giúp thu gọn lượng tham số kích hoạt trong quá trình huấn luyện, tiết kiệm tài nguyên GPU và tăng tốc suy luận ở các tác vụ quy mô lớn.

Giới phân tích nhận định mô hình này khó tạo ra cú hích lập tức như các bản phát hành hồi đầu năm, song khả năng duy trì hiệu quả với chi phí thấp có thể giúp DeepSeek gia tăng sức cạnh tranh với các tên tuổi lớn như OpenAI, Alibaba hay Baidu, nhất là trong nhóm khách hàng doanh nghiệp sử dụng API ở quy mô lớn.

Theo công bố của DeepSeek, giá API của V3.2-Exp "được cho là" thấp hơn 50% so với trước đây, tuy nhiên công ty chưa công bố chi tiết bảng giá để đối chiếu. Động thái này cho thấy DeepSeek đang tập trung vào hiệu quả vận hành thay vì chỉ dựa trên quy mô tham số.

Chiến lược dài hơi hay phép thử thị trường?

Thời điểm ra mắt V3.2-Exp trùng với giai đoạn các tập đoàn về công nghệ đang tăng tốc phát triển mô hình thế hệ mới.

OpenAI được cho là đang chuẩn bị giới thiệu bản kế nhiệm GPT-4; Alibaba mở rộng hệ sinh thái Qwen; Baidu và Tencent tiếp tục đẩy mạnh tích hợp AI vào nền tảng dịch vụ sẵn có.

Các công ty như Anthropic, Cohere hay xAI cũng liên tục cải tiến mô hình để tranh giành thị phần. Trong bối cảnh đó, lợi thế kết hợp giữa hiệu năng và chi phí thấp có thể giúp DeepSeek định vị ở nhóm doanh nghiệp vừa và nhỏ, nơi yếu tố giá thành mang tính quyết định.

Theo giới chuyên môn, khả năng xử lý chuỗi văn bản dài của V3.2-Exp phù hợp với các ứng dụng trong môi trường doanh nghiệp và ngành dịch vụ: trợ lý số đọc hiểu tài liệu nội bộ, hỗ trợ lập trình với ngữ cảnh mã nguồn phức tạp, phân tích dữ liệu chuyên ngành như pháp lý hoặc tài chính, vận hành chatbot có khả năng duy trì hội thoại dài, hay tạo nội dung dạng dài với độ nhất quán cao.

Nếu cơ chế Sparse Attention đạt hiệu quả thực tế như kỳ vọng, hướng tiếp cận này có thể trở thành lựa chọn mới thay cho việc tăng số tham số mô hình một cách tuyến tính.

Việc DeepSeek gọi V3.2-Exp là 'bước trung gian' cho thấy công ty đang chủ động thử nghiệm kiến trúc mới, thu thập phản hồi và tiếp tục đầu tư vào hoạt động nghiên cứu và phát triển (R&D) trước khi tung ra phiên bản hoàn thiện hơn. Hiện chưa có lịch trình cụ thể cho bản nâng cấp tiếp theo, nhưng động thái này cho thấy DeepSeek đang theo đuổi chiến lược dài hạn thay vì chỉ chạy theo truyền thông.

Nguồn Tuổi Trẻ: https://tuoitre.vn/deepseek-tung-v3-2-exp-xu-ly-van-ban-dai-gia-api-re-hon-50-20250930115151867.htm

Tin liên quan

Đề án 06, VNeID là hình mẫu thành công trong giải quyết niềm tin số

Dữ liệu ‘đúng, đủ, sạch, sống’ là chìa khóa để giải quyết bài toán niềm tin số cho người dân, doanh nghiệp.

VietNamNet 4 giờ trước

Chuyên gia Mỹ cảnh báo sốc: AI siêu trí tuệ có thể xóa sổ loài người, xác suất tới 99%

Những cảnh báo về rủi ro từ trí tuệ nhân tạo (AI) đang ngày càng được nhấn mạnh, khi một số nhà khoa học lo ngại công

Tuổi Trẻ 5 giờ trước

Trung Quốc lên án quy định 'ác ý' mới của Mỹ nhắm vào các tập đoàn công nghệ

Động thái siết chặt kiểm soát xuất khẩu của Mỹ nhắm vào các tập đoàn công nghệ Trung Quốc đã làm dấy lên căng thẳng m

Tuổi Trẻ 6 giờ trước

Nhập viện, lỡ chuyến bay vì nhẫn Samsung bị phồng pin

Samsung thừa nhận đã xảy ra sự cố hiếm gặp về việc nhẫn Galaxy Ring bị phồng lên và khiến một YouTuber phải vào viện,

ZNews 7 giờ trước

MISA nâng tầm nhân sự công nghệ với GitHub Copilot

Hơn 450 lập trình viên MISA đang đồng hành cùng GitHub Copilot để tối ưu công việc lặp lại, dành nhiều thời gian hơn

VietNamNet 8 giờ trước

Dấu ấn VNPT Cloud giữa tâm điểm hạ tầng số Việt Nam

Hội nghị Vietnam Cloud & Datacenter Convention 2025 tại TP.HCM quy tụ chuyên gia hạ tầng số, bàn chủ quyền dữ liệ

VietNamNet 8 giờ trước

Quân đội Mỹ có kiểm định độ bền máy tính?

Nhiều nhà sản xuất quảng cáo chức năng độ bền đạt chuẩn quân đội.

ZNews 9 giờ trước

AI - thách thức mới cho người trẻ khi tìm việc

AI bùng nổ đặt ra thách thức mới cho người trẻ: những người biết cách tận dụng công nghệ để làm nổi bật bản thân và n

VietNamNet 9 giờ trước

iPhone 17 gặp vấn đề lạ

Nhiều mẫu iPhone 17 trưng bày tại Apple Store xuất hiện vết xước, khiến nhân viên cửa hàng phải thay đổi chân đế MagS

ZNews 9 giờ trước

Galaxy Tab S11 Series trợ giúp đắc lực cho người làm kinh doanh

Thiết kế mỏng nhẹ dễ mang đi công tác, Galaxy AI hữu dụng và hiệu suất ổn định khiến Galaxy Tab S11 Series trở thành

VietNamNet 10 giờ trước

Bài học mở cửa Internet và dòng chảy về tư duy đổi mới của ngành TT&TT

Vào những giờ chót thuyết phục cho mở Internet, ở cấp cao nhất là Bộ Chính trị và Thủ tướng đã đặt ra câu hỏi nếu mở

VietNamNet 11 giờ trước

MobiFone và SOVICO hợp tác xây dựng hệ sinh thái công nghệ đa tiện tích

Tổng công ty Viễn thông MobiFone và SOVICO Group đã ký kết Biên bản ghi nhớ hợp tác toàn diện, mở ra hành trình kiến

VietNamNet 12 giờ trước

YouTube trả hơn 24 triệu USD dàn xếp vụ kiện khóa tài khoản ông Trump

YouTube đồng ý chi 24,5 triệu USD, trở thành công ty công nghệ lớn thứ ba sau Meta và X phải 'xuống tiền' dàn xếp với

Tuổi Trẻ 12 giờ trước

California thông qua luật an toàn AI đầu tiên tại Mỹ

California vừa trở thành bang đầu tiên của Mỹ ban hành luật an toàn trí tuệ nhân tạo (AI), đánh dấu bước ngoặt trong

Tuổi Trẻ 14 giờ trước

AIT - cầu nối công nghệ in 3D, đồng hành cùng Stratasys - Vinmec - VinUni

Ngày 11/9/2025, Stratasys ký kết hợp tác chiến lược với Vinmec và VinUni, cùng AIT mở ra kỷ nguyên ứng dụng công nghệ

VietNamNet 14 giờ trước

DeepSeek tung V3.2-Exp xử lý văn bản dài, giá API rẻ hơn 50%

Tăng tốc suy luận, tiết kiệm tài nguyên

Chiến lược dài hơi hay phép thử thị trường?

Tin liên quan

Tin nổi bật