Запуск модели рассуждений Ring 1T на одном M3 Ultra с mlx-lm. Она квантована до 3,5 бит на вес. Использует 440 ГБ и сгенерировала ~6k токенов со скоростью 18,2 токена в секунду. Становится ближе к GPT-5 дома.
Вот игра Space Invaders, которую она сгенерировала:
39,5K