O mlx-lm mais recente está ativo: pip install -U mlx-lm - Alguns novos modelos, incluindo o Code World Model da Meta - Inferência em lote para SSMs híbridos e atenção de janela deslizante