Demo lain dari kinerja LLM di perangkat iPhone 17 Pro Kali ini dengan Ling mini 2.0 by @TheInclusionAI, model MoE 16B dengan parameter aktif 1.4B yang berjalan pada ~120tk/s Terima kasih kepada @awnihannun untuk kuantitas MLX DWQ 2-bit