Exécution du GLM 4.7 complet (8 bits) sur 2 x 512 Go de Mac Studios M3 Ultra Fonctionne à 19,8 tok/sec avec le backend RDMA MLX de @exolabs (merci à @awnihannun) et le parallélisme tensoriel