Esecuzione del modello di ragionamento Ring 1T su un singolo M3 Ultra con mlx-lm. È quantizzato a 3,5 bit per peso. Utilizza 440 GB e ha generato ~6k token a 18,2 toks/sec. Ci stiamo avvicinando a GPT-5 a casa.
Ecco il gioco degli space invaders che ha generato:
48,67K