La primera versión de mlx-lm en 2026 está empaquetada: pip install -U mlx-lm - Un montón de modelos nuevos (h/t @kernelpool, @JohnMai_Dev) - Mucho mejor soporte para la llamada y razonamiento de herramientas en mlx_lm.server - Soporte para la cuantización mxfp8 y nvfp4 (requiere mlx previo al lanzamiento)