Uruchamianie modelu rozumowania Ring 1T na pojedynczym M3 Ultra z mlx-lm. Jest skwantyzowany do 3,5 bitów na wagę. Używa 440 GB i wygenerował ~6k tokenów przy 18,2 toks/sec. Coraz bliżej do GPT-5 w domu.
Oto gra w Space Invaders, którą wygenerował:
48,65K