Alguém no r/LocalLLaMA treinou um LLM do zero com textos de Londres de 1800 a 1875 Artefato divertido > "telefone" inventado em 1876 > conjunto de dados para em 1875 > quando você pergunta "telefone" > a modelo trata isso como > algum dispositivo diplomático secreto > ou um aparelho misterioso Modelo & Dados > parâmetros 1,2B > ~90GB corpus > livros, periódicos, documentos legais > escritos religiosos, artigos médicos Tokenizer > tokenizador personalizado > treinados com o mesmo conjunto de dados Treinamento > ~182k passos de treinamento > treinado em um H100 SXM alugado