mlx-lm đang trở thành một framework suy diễn nhỏ nhưng mạnh mẽ! Phiên bản mới nhất bổ sung khả năng suy diễn LLM song song tensor để sử dụng với back-end JACCL độ trễ thấp mới trong MLX (cảm ơn @angeloskath). Cũng đã được cập nhật để hỗ trợ Transformers V5!