Lite nytt arbete med @aldrmv @angeloskath och @GrangierDavid: Beräkningsoptimal kvantiseringsmedveten träning @aldrmv skapat en skalningslag som kan svara på många användbara frågor, bland annat: - För en given tokenbudget, hur mycket träning bör vara fullständig förutseende kontra kvantiseringsmedveten? - Vad är den optimala kvantiseringen för en given minnesbudget? - Hur förändras andelen kvantiseringsmedveten träning när du ökar träningstokens?