Proteinspråksmodeller har precis fått en uppgradering. Det här är Profluent-E1: en fri, flexibel proteinsekvenskodare. E1 är byggd med hämtningsförstärkning för att lära sig av flera sekvenser. Modeller tränade över 4T-tokens med endast 150M-600M params, E1 är SOTA för funktionella och oövervakade strukturella uppgifter med noll skott. Det höjer ribban för inlärning av proteinrepresentation och är fritt tillgängligt idag.