Các mô hình Mixture-of-Experts (MoE) như DeepSeek-R1 mở ra những cấp độ khả năng mới—nhưng chỉ khi chúng có thể mở rộng một cách hiệu quả. Đó là lúc thiết kế phần cứng-phần mềm cực đoan ở quy mô giá đỡ phát huy tác dụng. Với NVIDIA Blackwell và NVIDIA Dynamo, các nhà cung cấp dịch vụ AI có thể biến các cụm thành các hệ thống suy diễn thông minh—đạt được hiệu suất và doanh thu gấp 10 lần trong khi giảm chi phí mỗi token.
Bây giờ, với NVIDIA Dynamo tích hợp với các nhà cung cấp đám mây lớn, hiệu suất đột phá đó có sẵn cho khách hàng đám mây—bao gồm cả @AWSCloud, @Azure, @GoogleCloud và @OracleCloud. Tìm hiểu thêm:
187