Další ukázka výkonu LLM na zařízení iPhone 17 Pro Tentokrát s Ling mini 2.0 od @TheInclusionAI, 16B MoE modelem s 1.4B aktivními parametry běžícími na ~120tk/s Díky @awnihannun pro MLX DWQ 2-bitové kvanty