Executando o modelo de raciocínio Ring 1T em um único M3 Ultra com mlx-lm. É quantizado para 3,5 bits por peso. Usa 440 GB e gerou ~ 6k tokens a 18,2 toks/seg. Aproximando-se do GPT-5 em casa.
Aqui está o jogo de invasores espaciais que ele gerou:
39,51K