Model bahasa protein baru saja mendapat peningkatan. Temui Profluent-E1: encoder urutan protein gratis, fleksibel, dan perbatasan. E1 dibangun dengan augmentasi pengambilan untuk belajar dari beberapa urutan. Model yang dilatih lebih dari token 4T dengan hanya 150M-600M param, E1 adalah SOTA untuk tugas fungsional dan struktural tanpa pengawasan. Ini meningkatkan standar untuk pembelajaran representasi protein dan tersedia secara gratis saat ini.