mlx-lm staje się dość potężnym małym frameworkiem do wnioskowania! Najnowsza wersja dodaje wnioskowanie LLM z równoległym tensorowym przetwarzaniem do użycia z nowym backendem JACCL o niskim opóźnieniu w MLX (dzięki @angeloskath). Zaktualizowano również, aby wspierać Transformers V5!