Freue mich, ein Papier zu teilen, das wir bei Apple geschrieben haben – „Compute-Optimal Quantization-Aware Training“! TLDR: Behandle QAT als Bürger erster Klasse und plane es im Voraus, wenn du das beste quantisierte Modell mit der verfügbaren Rechenleistung erreichen möchtest. 🧵🧵🧵