I modelli linguistici delle proteine hanno appena ricevuto un aggiornamento. Incontra Profluent-E1: un codificatore di sequenze proteiche gratuito, flessibile e all'avanguardia. E1 è costruito con un'augmentazione di recupero per apprendere da più sequenze. Modelli addestrati su oltre 4T token con solo 150M-600M parametri, E1 è SOTA per compiti funzionali zero-shot e strutturali non supervisionati. Alza il livello per l'apprendimento della rappresentazione delle proteine ed è disponibile gratuitamente oggi.