在以前未見的條件下,例如疾病或對藥物的反應,預測細胞狀態通常需要針對每個新的生物學背景進行重新訓練。今天,Arc 正在推出 Stack,一個基礎模型,能夠在推理時直接學習在新穎條件下模擬細胞狀態,無需微調。
Stack 捕捉到大多數模型所忽略的東西:細胞環境。處於發炎組織中的 T 細胞行為不同,不僅僅是因為它自己的基因,而是因為它的環境。Stack 將細胞一起處理並從這些關係中學習。
正如文本提示引導語言模型,細胞在 Stack 中充當提示。它可以觀察接受藥物處理的免疫細胞,並預測上皮細胞對相同藥物的反應,這是一項從未明確訓練過的任務。這是第一個能夠進行上下文學習的單細胞基礎模型,或在推理過程中對新任務進行概括。
團隊應用 Stack 建立了 Perturb Sapiens:一個包含約 20,000 種預測細胞反應的圖譜,涵蓋 28 種組織和 201 種擾動 + 一個使用保留數據集驗證的子集,確認預測捕捉了真實的生物學。
483