Os modelos de linguagem de proteínas acabaram de receber uma atualização. Conheça o Profluent-E1: um codificador de sequência de proteínas gratuito, flexível e de ponta. O E1 é construído com aumento de recuperação para aprender a partir de múltiplas sequências. Modelos treinados com mais de 4T de tokens e apenas 150M-600M de parâmetros, o E1 é SOTA para tarefas funcionais de zero-shot e estruturais não supervisionadas. Ele eleva o padrão para o aprendizado de representação de proteínas e está disponível gratuitamente hoje.