Das Ring 1T-Reasoning-Modell läuft auf einem einzelnen M3 Ultra mit mlx-lm. Es ist auf 3,5 Bits pro Gewicht quantisiert. Verwendet 440 GB und generierte ~6k Tokens bei 18,2 toks/sec. Wir kommen dem GPT-5 zu Hause näher.
Hier ist das Space Invaders-Spiel, das es generiert hat:
48,64K