Цікаве відео від @digitalix про використання нового mlx.distributed бекенду для швидкого виведення LLM за допомогою mlx-lm і @exolabs Також дякую за просте пояснення різниці між старим і новим — хоча масштабування має бути трохи сублінійним 😉