Les modèles de langage protéique viennent de recevoir une mise à niveau. Découvrez Profluent-E1 : un encodeur de séquences protéiques gratuit, flexible et à la pointe. E1 est construit avec une augmentation de récupération pour apprendre à partir de plusieurs séquences. Les modèles entraînés sur plus de 4T de tokens avec seulement 150M-600M de paramètres, E1 est SOTA pour les tâches fonctionnelles en zéro-shot et les tâches structurelles non supervisées. Il élève le niveau de l'apprentissage de la représentation des protéines et est disponible gratuitement dès aujourd'hui.