Appleで書いた論文「Compute-Optimal Quantization-Aware Training」を共有できることを嬉しく思います。 TLDR: QAT を一級市民として扱い、持っているコンピューティングで最高の量子化モデルを実現したい場合は、事前に計画してください。 🧵🧵🧵