Языковые модели белков только что получили обновление. Познакомьтесь с Profluent-E1: бесплатным, гибким, передовым кодировщиком последовательностей белков. E1 создан с использованием дополнения для извлечения, чтобы учиться на множестве последовательностей. Модели, обученные на более чем 4 триллионах токенов с всего лишь 150M-600M параметрами, E1 является SOTA для нулевых функциональных и неконтролируемых структурных задач. Он поднимает планку для обучения представлению белков и доступен бесплатно уже сегодня.