Модель міркування Running Ring 1T на одному M3 Ultra з mlx-lm. Він кількісно становить 3,5 біта на вагу. Використовує 440 ГБ і генерує ~6 тисяч токенів зі швидкістю 18,2 ток/сек. Як наблизитися до GPT-5 у домашніх умовах.
Ось гра про космічних загарбників, яку вона створила:
39,51K