運行 Minimax M2.1 (@MiniMax__AI) 與 OpenCode (@opencode) 和 mlx_lm.server。 在 M3 Ultra 上運行得相當好。一旦 KV 快取變暖,提示處理速度相當快。而且令牌生成非常快速。