Ejecutando el modelo de razonamiento Ring 1T en un solo M3 Ultra con mlx-lm. Está cuantificado a 3.5 bits por peso. Utiliza 440GB y generó ~6k tokens a 18.2 toks/seg. Acercándose a GPT-5 en casa.
Aquí está el juego de Space Invaders que generó:
39,51K