Leuke video van @digitalix over het gebruik van de nieuwe mlx.distributed back-end voor snelle LLM-inferentie met mlx-lm en @exolabs Ook bedankt voor het uitleggen van het verschil tussen de oude en de nieuwe in eenvoudige termen - hoewel schaling iets sub-lineair zou moeten zijn 😉