一些與 @aldrmv @angeloskath 和 @GrangierDavid 的新工作: 計算最佳量化感知訓練 @aldrmv 建立了一個縮放法則,可以回答許多有用的問題,包括: - 在給定的標記預算下,應該有多少訓練是完全預測的,多少是量化感知的? - 在給定的記憶體預算下,最佳的量化是多少? - 隨著訓練標記的增加,量化感知訓練的比例如何變化?