Passei algumas horas esta manhã apenas ajustando a linguagem no material RL do livro RLHF com base no ótimo feedback das pessoas online. Ser capaz de obter esse feedback gratuitamente é incrível, e eu aprecio muito.
Em seguida, passei uma hora atualizando as ferramentas do RLHF Book, então espero que mais pessoas possam construir livros com ele. Os agentes de código tornam a criação de sites e conteúdo dinâmico super divertida. Eu sinto que o repositório que construí é subestimado para pessoas que tentam coisas de pandoc.
4,62K