Câteva lucrări noi cu @aldrmv @angeloskath și @GrangierDavid: Instruire de calcul optim în funcție de cuantizare @aldrmv construit o lege de scalare care poate răspunde la multe întrebări utile, inclusiv: - Pentru un anumit buget token, cât de multă pregătire ar trebui să fie conștientă de previziune completă vs cuantificare? - Pentru un anumit buget de memorie, care este cuantificarea optimă? - Cum se schimbă fracțiunea de antrenament conștient de cuantificare pe măsură ce creșteți jetoanele de antrenament?