¡MLX-LM se está convirtiendo en un pequeño marco de inferencia bastante potente! La última versión añade inferencia de LLM tensor-paralelo para su uso con el nuevo back-end JACCL de baja latencia en MLX (h/t @angeloskath). ¡También actualizado para soportar Transformers V5!