Chạy mô hình lý luận Ring 1T trên một M3 Ultra duy nhất với mlx-lm. Nó được định lượng thành 3,5 bit trên trọng số. Sử dụng 440GB và tạo ra ~6k token với tốc độ 18,2 token/giây. Đang tiến gần hơn đến GPT-5 tại nhà.
Đây là trò chơi xâm lược không gian mà nó đã tạo ra:
48,64K