Rularea modelului de raționament Ring 1T pe un singur M3 Ultra cu mlx-lm. Este cuantificat la 3,5 biți pe greutate. Folosește 440 GB și a generat ~6k jetoane la 18,2 toks/sec. Ne apropiem de GPT-5 acasă.
Iată jocul Space Invaders pe care l-a generat:
39,52K