Rulând complet GLM 4.7 (8-bit) pe 2 M3 Ultra Mac Studios de 512GB Funcționează la 19,8 tok/sec cu @exolabs MLX RDMA backend (h/t @awnihannun) și tensor paralel