Jazykové modely proteinů se právě dočkaly vylepšení. Seznamte se s Profluent-E1: bezplatným, flexibilním, hraničním kodérem proteinových sekvencí. E1 je postaven s augmentací vyhledávání, aby se učil z více sekvencí. Modely trénované přes 4T tokeny s pouhými 150M-600M parametry, E1 je SOTA pro funkční a neřízené strukturální úlohy s nulovým záběrem. Zvyšuje laťku pro učení reprezentace proteinů a je dnes volně dostupný.