Nhảy đến nội dung
 

Bước tiến lớn của Huawei

Chip AI Ascend của Huawei đã vượt hiệu suất GPU Nvidia trong bài thử mô hình DeepSeek R1, cho thấy ông lớn công nghệ Trung Quốc đang tìm cách phá vỡ thế độc tôn của Mỹ.

Theo SCMP, một báo cáo kỹ thuật mới cho thấy chip xử lý AI Ascend của Huawei đã vượt qua hiệu suất của GPU Nvidia trong bài thử nghiệm mô hình trí tuệ nhân tạo DeepSeek R1. Kết quả này đánh dấu bước tiến quan trọng của công ty Trung Quốc trong bối cảnh phải đối mặt với các lệnh kiểm soát công nghệ từ Mỹ.

Bài báo được đồng tác giả bởi các nhà nghiên cứu từ Huawei và công ty khởi nghiệp hạ tầng AI SiliconFlow, mô tả chi tiết kiến trúc trung tâm dữ liệu CloudMatrix 384. Đây là một “siêu hệ thống chip AI” được thiết kế chuyên biệt để xử lý khối lượng công việc khổng lồ từ các mô hình ngôn ngữ lớn (LLM).

CloudMatrix 384 bao gồm 384 bộ xử lý Ascend 910C và 192 bộ xử lý trung tâm Kunpeng, kết nối với nhau bằng hệ thống bus thống nhất có độ trễ thấp cũng như băng thông cao. Kiến trúc này được Huawei kỳ vọng sẽ định hình lại nền tảng của cơ sở hạ tầng AI.

Hệ thống CloudMatrix-Infer được xây dựng dựa trên nền tảng này cho thấy hiệu suất vượt trội khi triển khai mô hình DeepSeek R1. Trong giai đoạn xử lý ban đầu (prefill), hệ thống đạt thông lượng 6.688 token/giây trên mỗi NPU khi xử lý yêu cầu dài 4.000 token từ người dùng. Hiệu suất này tương đương 4,45 token/giây trên mỗi TFLOPS (nghìn tỷ phép tính/giây).

Trong giai đoạn giải mã, CloudMatrix ghi nhận thông lượng 1.943 token/giây trên mỗi NPU, với thời gian phản hồi dưới 50 mili giây cho mỗi token. Hiệu suất này đạt 1,29 token/giây trên mỗi TFLOPS, cao hơn hệ thống SGLang của Nvidia sử dụng GPU H100 và cả nền tảng dùng GPU H800 để chạy DeepSeek R1.

Theo Zuo Pengfei, tác giả chính của nghiên cứu và thành viên chương trình “Genius Youth” của Huawei, mục tiêu của báo cáo nhằm giúp ngành công nghiệp hiểu đầy đủ về khả năng của NPU Ascend do Trung Quốc phát triển. Trên nền tảng Zhihu, ông khẳng định báo cáo là minh chứng rõ ràng cho năng lực công nghệ của Huawei CloudMatrix.

Đây là lần đầu tiên Huawei công bố chi tiết kỹ thuật về bộ tăng tốc AI Ascend 910C. Báo cáo cũng nhắc lại phát biểu gần đây của ông Nhậm Chính Phi, nhà sáng lập Huawei rằng chip Ascend vẫn “tụt hậu một thế hệ” so với các đối thủ từ Mỹ. Tuy nhiên, ông khẳng định việc áp dụng các phương pháp như “xếp chồng và phân cụm” đã giúp Huawei đạt được hiệu suất tính toán tương đương các hệ thống AI tiên tiến nhất hiện nay.

Trong khi đó, CEO Jensen Huang của Nvidia cũng thừa nhận trong một cuộc phỏng vấn với CNBC rằng AI là một vấn đề xử lý song song và họ sẽ cần nhiều vi xử lý hơn nếu chúng không đủ sức mạnh tính toán.

Những nhà khoa học tiên phong

"Những nhà khoa học tiên phong" là một cuốn sách thú vị về lịch sử của những phát minh nổi tiếng. Để có được những đóng góp vĩ đại cho nhân loại, các nhà khoa học nổi tiếng đã làm việc với lòng say mê và tinh thần học hỏi không ngừng.

 
 
 
logo
CÔNG TY CỔ PHẦN XÂY DỰNG SẢN XUẤT VÀ THƯƠNG MẠI ĐẠI SÀN

GPĐKKD: 0103884103 do sở KH & ĐT TP Hà Nội cấp lần đầu ngày 29/06/2009.

Địa chỉ: Gian số L4-07 tầng 4, nơ-2 - Gold Season,  47 Nguyễn Tuân, Thanh Xuân, Hà Nội

MIỀN BẮC

Địa chỉ Showroom: D11-47 KĐT Geleximco Lê Trọng Tấn, Hà Đông, Hà Nội

Điện thoại  Điện thoại: 1900 98 98 36

MIỀN NAM

Địa chỉ VPGD: 57/1c, Khu phố 1, Phường An Phú Đông, Quận 12, Thành phố Hồ Chí Minh

Điện thoại  Email: info@daisan.vn