Ejecutando el GLM 4.7 completo (8 bits) en 2 Mac Studios M3 Ultra de 512GB Funciona a 19,8 tok/seg con @exolabs backend MLX RDMA (h/t @awnihannun) y tensor paralelo