Nemotron 3 NanoはM4 Maxでmlx-lmとうまく動作します。 Macでローカルに使うのに素晴らしいモデルになりそうです。MoE+ハイブリッドの注意で、非常に長いコンテキストでも高速に使えます。 4ビットモデルによるリアルタイム生成: