來自 @digitalix 的有趣視頻,介紹如何使用新的 mlx.distributed 後端快速進行 LLM 推理,搭配 mlx-lm 和 @exolabs。 也感謝你用簡單的術語解釋舊版和新版之間的區別——不過擴展應該是略微次線性的 😉