如果你一年多没有尝试过本地 LLM 我告诉你,试试 Nemotron 3 Nano 它可以在土豆 GPU 上运行 感谢专家的卸载 它甚至可以完全在 CPU + RAM 上运行 这只是你机器上 AI 生活的预览,而它将是最糟糕的状态 Unsloth 有很好的量化和规模