蛋白質語言模型剛剛升級。介紹 Profluent-E1:一個免費、靈活、前沿的蛋白質序列編碼器。 E1 具備檢索增強功能,可以從多個序列中學習。該模型在僅有 150M-600M 參數的情況下,訓練了超過 4T 的標記,E1 在零-shot 功能和無監督結構任務中達到了 SOTA。它提升了蛋白質表示學習的標準,並且今天可以免費使用。