Executando o GLM 4.7 completo (8 bits) em 2 x 512GB M3 Ultra Mac Studios Funciona a 19.8 tok/seg com o backend RDMA MLX da @exolabs (agradecimentos a @awnihannun) e paralelismo de tensores