O altă demonstrație a performanței LLM pe dispozitiv a iPhone 17 Pro De data aceasta cu Ling mini 2.0 de @TheInclusionAI, un model MoE de 16B cu parametri activi de 1.4B care rulează la ~120tk/s Mulțumim @awnihannun pentru cuantiștii MLX DWQ pe 2 biți