Bucuros să împărtășesc o lucrare pe care am scris-o la Apple - "Compute-Optimal Quantization-Aware Training"! TLDR: Tratați QAT ca pe un cetățean de primă clasă și planificați-l în avans dacă doriți să obțineți cel mai bun model cuantificat cu calculul pe care îl aveți. 🧵🧵🧵