Nemotron 3 Nano 在 M4 Max 上運行良好。 這可能是 Mac 本地使用的絕佳模型:MoE + 混合注意力使其即使在非常長的上下文中也能快速運行。 使用 4 位模型實時生成: