Prevedere lo stato cellulare in condizioni precedentemente sconosciute, come malattie o in risposta a un farmaco, ha tipicamente richiesto un riaddestramento per ogni nuovo contesto biologico. Oggi, Arc sta rilasciando Stack, un modello di base che impara a simulare lo stato cellulare in condizioni nuove direttamente al momento dell'inferenza, senza necessità di fine-tuning.
Stack cattura qualcosa che la maggior parte dei modelli perde: il contesto cellulare. Una cellula T nei tessuti infiammati si comporta in modo diverso, non solo a causa dei propri geni, ma anche a causa del suo ambiente. Stack elabora le cellule insieme e apprende da quelle relazioni.
Proprio come i prompt testuali guidano i modelli linguistici, le cellule fungono da prompt in Stack. Può osservare le cellule immunitarie trattate con farmaci e prevedere come le cellule epiteliali risponderebbero allo stesso farmaco, un compito mai esplicitamente addestrato. È il primo modello fondazionale a singola cellula capace di apprendimento in contesto, o di generalizzare a nuovi compiti durante l'inferenza.
Il team ha applicato Stack per costruire Perturb Sapiens: un atlante di ~20.000 risposte cellulari previste attraverso 28 tessuti e 201 perturbazioni + un sottoinsieme convalidato utilizzando dataset riservati, confermando che le previsioni catturano la biologia reale.
269