Executando o modelo de raciocínio Ring 1T em um único M3 Ultra com mlx-lm. Está quantizado para 3,5 bits por peso. Usa 440GB e gerou ~6k tokens a 18,2 toks/seg. Aproximando-se do GPT-5 em casa.
Aqui está o jogo dos invasores do espaço que ele gerou:
39,51K