Wenn du in über einem Jahr keinen lokalen LLM ausprobiert hast, sage ich dir, probiere Nemotron 3 Nano aus. Es läuft auf einer Kartoffel-GPU, dank der Experten, die die Last abladen. Es läuft sogar vollständig auf CPU + RAM. Nur ein Vorgeschmack auf KI, die auf deinem Gerät lebt, und es wird nie schlechter sein. Unsloth hat gute Quants & Größen.