NVIDIA Nemotron Nano 3 đã có mặt trên OpenRouter! Đây là một mô hình lý luận MoE nhỏ được xây dựng cho các hệ thống AI tác động chuyên biệt. Giống như những mô hình khác trong gia đình Nemotron, Nano 3 hoàn toàn mở với: - Trọng số mở, dữ liệu mở, & công thức mở - Được thiết kế cho việc tùy chỉnh & tối ưu hóa
@nvidia Một số thông tin thú vị về mô hình: - Hỗn hợp Chuyên gia (MoE) với kiến trúc hybrid transformer-mamba cho việc tạo ra token cao nhất - "Ngân sách suy nghĩ" để tránh suy nghĩ quá nhiều cho chi phí suy diễn có thể dự đoán - 30B MoE với 3B tham số hoạt động, 256k ngữ cảnh
Một số trường hợp sử dụng ví dụ: - Tài chính: trích xuất tài liệu, phân tích thu nhập và phát hiện gian lận - An ninh mạng: phân loại lỗ hổng, phân tích phần mềm độc hại và săn lùng mối đe dọa - Nhà phát triển: tóm tắt, tái cấu trúc và lý luận về mã - Bán lẻ: gợi ý cá nhân hóa theo thời gian thực và hỗ trợ
30