Algunos trabajos nuevos con @aldrmv @angeloskath y @GrangierDavid: Entrenamiento consciente de cuantización óptima para computación @aldrmv construyó una ley de escalado que puede responder muchas preguntas útiles, incluyendo: - Para un presupuesto de tokens dado, ¿cuánto entrenamiento debería ser de previsión completa frente a consciente de cuantización? - Para un presupuesto de memoria dado, ¿cuál es la cuantización óptima? - ¿Cómo cambia la fracción de entrenamiento consciente de cuantización a medida que aumentas los tokens de entrenamiento?