Köra Ring 1T resonemangsmodell på en enda M3 Ultra med mlx-lm. Den kvantiseras till 3,5 bitar per vikt. Använder 440 GB och genererade ~6k tokens med 18,2 toks/sek. Att komma närmare GPT-5 på hemmaplan.
Här är Space Invaders-spelet som det genererade:
48,65K