Exécution du modèle de raisonnement Ring 1T sur un seul M3 Ultra avec mlx-lm. Il est quantifié à 3,5 bits par poids. Utilise 440 Go et a généré ~6k tokens à 18,2 toks/sec. On se rapproche de GPT-5 à la maison.
Voici le jeu des envahisseurs de l'espace qu'il a généré :
48,64K