Het draaien van het Ring 1T redeneermodel op een enkele M3 Ultra met mlx-lm. Het is gekwantiseerd naar 3,5 bits-per-gewicht. Gebruikt 440GB en genereerde ~6k tokens met 18,2 toks/sec. We komen dichter bij GPT-5 thuis.
Hier is het ruimte-invaders spel dat het heeft gegenereerd:
39,51K