NVIDIA Nemotron Nano 3 已在 OpenRouter 上线! 它是一个为专门的代理 AI 系统构建的小型 MoE 推理模型。 与 Nemotron 家族中的其他成员一样,Nano 3 完全开放,具有: - 开放的权重、开放的数据和开放的配方 - 设计用于定制和优化
@nvidia 关于该模型的一些有趣事实: - 采用混合专家(MoE)与混合变换器-曼巴架构,以实现最高的令牌生成 - "思考预算",以避免过度思考,从而实现可预测的推理成本 - 30B MoE,具有3B活跃参数,256k上下文
一些示例用例: - 财务:提取文档,分析收入,发现欺诈 - 网络安全:分类漏洞,分析恶意软件,追踪威胁 - 开发者:总结、重构和推理代码 - 零售:实时个性化推荐和支持
34