Моделі білкової мови щойно отримали оновлення. Зустрічайте Profluent-E1: безкоштовний, гнучкий, прикордонний кодувальник білкових послідовностей. E1 побудований за допомогою аугментації пошуку для навчання з кількох послідовностей. Моделі тренують понад 4T токенів лише з 150M-600M параметрами, E1 — це SOTA для функціональних і неконтрольованих структурних завдань з нульовим пострілом. Він піднімає планку для вивчення репрезентації білка і сьогодні знаходиться у вільному доступі.