Jag är glad att kunna dela med mig av en artikel som vi skrev på Apple - "Compute-Optimal Quantization-Aware Training"! TLDR: Behandla QAT som en förstklassig medborgare och planera det i förväg om du vill uppnå den bästa kvantiserade modellen med den beräkning du har. 🧵🧵🧵