Rolig video från @digitalix om att använda den nya mlx.distributed back-end för att göra snabb LLM-inferens med mlx-lm och @exolabs Tack också för att du förklarade skillnaden mellan det gamla och det nya på ett enkelt sätt – även om skalningen bör vara något sublinjär 😉