это на самом деле безумие с тех пор как появился AI, у каждой модели в биологии было одно и то же ограничение: обучите её на одной болезни, она работает только с этой болезнью. переобучение для любого нового лекарства, пациента или ткани. обещание фундаментальной модели для биологии, по сути, не существовало. нулевая предсказательная способность была невозможна. до сих пор. Модель Arc Institute (Stack) обучается на группах клеток, а не по одной. так же, как LLM видят слова в предложении, а не изолированно, клетки становятся контекстом друг для друга. вы можете показать ей клетки, которые были обработаны лекарством, и она предсказывает, как совершенно разные клетки отреагируют на то же самое лекарство. даже если никто никогда не проводил этот эксперимент. даже если эта ткань никогда не подвергалась воздействию. даже если эта комбинация никогда не существовала в обучении. сами клетки становятся подсказками, просто из вывода. теперь вы можете задавать вопросы биологии. "что сделают клетки печени, если я дам им это противораковое лекарство?" и она отвечает с фактическими предсказаниями экспрессии генов. ещё не идеально, но достаточно хорошо, чтобы обойти существующие методы в 28 из 31 тестов (что в этой области считается практически беспрецедентным, где 60% считается хорошим результатом). они использовали это для создания виртуальной атласа нарушений: 28 человеческих тканей, 40 классов клеток, 201 лекарство. лаборатория не требуется. чисто в силе. когда они проверили против реальных экспериментов в лаборатории, предсказания совпали. открытие лекарств в настоящее время стоит более 5 миллионов долларов и 2 года на эксперимент, который может не сработать. теперь вы сначала проводите скрининг вычислительно. "какие ткани будут иметь побочные эффекты?" "как клетки этого пациента будут реагировать иначе?" вопросы, которые раньше требовали миллионов в грантах, теперь требуют только GPU. медленно, но верно мы решаем проблемы биологии.