Senang membagikan makalah yang kami tulis di Apple — "Compute-Optimal Quantization-Aware Training"! TLDR: Perlakukan QAT sebagai warga kelas satu dan rencanakan terlebih dahulu jika Anda ingin mencapai model terkuantisasi terbaik dengan komputasi yang Anda miliki. 🧵🧵🧵