Hoje marca uma grande conquista para o Nous, mas também potencialmente para o cenário de IA. Iniciamos uma execução de pré-treinamento descentralizada do que é basicamente um Deepseek denso - parâmetros 40B, mais de 20T tokens, com MLA para eficiência de contexto longo. Todos os pontos de verificação, não preenchidos, recozidos, o conjunto de dados, tudo será aberto ao vivo à medida que o treinamento avança. Confira o blog que a equipe do Psyche lidera @DillonRolnick, escreveram @theemozilla e Ari no tweet de citação para aprender *muito* mais sobre a infraestrutura.