Kolejna demonstracja wydajności LLM na urządzeniu iPhone 17 Pro Tym razem z Ling mini 2.0 od @TheInclusionAI, model MoE 16B z 1,4B aktywnymi parametrami działającymi z prędkością ~120tk/s Dzięki @awnihannun za MLX DWQ 2-bitowe kwanty