Alguns novos trabalhos com @aldrmv @angeloskath e @GrangierDavid: Treinamento com reconhecimento de quantização ideal de computação @aldrmv construiu uma lei de escala que pode responder a muitas perguntas úteis, incluindo: - Para um determinado orçamento de token, quanto treinamento deve ser totalmente consciente da previsão versus quantização? - Para um determinado orçamento de memória, qual é a quantização ideal? - Como a fração de treinamento com reconhecimento de quantização muda à medida que você aumenta os tokens de treinamento?