Blij om een paper te delen die we bij Apple hebben geschreven — “Compute-Optimal Quantization-Aware Training”! TLDR: Behandel QAT als een eerste klas burger en plan het van tevoren als je het beste gekwantiseerde model wilt bereiken met de rekenkracht die je hebt. 🧵🧵🧵