在过去的一周里,@arcinstitute 发布了三项新的发现,我对此感到非常自豪。 • 世界上首个功能性 AI 生成的基因组。利用 Evo 2(有史以来训练过的最大生物学机器学习模型,Arc 于 2 月与 @nvidia 合作发布),Arc 科学家利用 Evo 2 是一个生成模型的事实,生成了完整噬菌体基因组的全新序列。也就是说,他们使用 AI 生成了完全新的、自然界从未见过的基因组。他们实验合成了这些基因组,并展示了这些 AI 生成的噬菌体确实有效,以高效能杀死大肠杆菌。 • Germinal,一个用于创建新抗体的 AI 系统。抗体设计是医学生物学中的一个重大问题,因为它们对创造治疗药物的重要性和实用性显而易见。(抗体是帮助免疫系统识别病原体和其他有害入侵者的小颗粒。另请参见最近关于此主题的《进行中的工作》文章:[1]。)如今,设计有效的抗体非常昂贵且缓慢。Germinal 是一种便宜且快速的药物候选者生产方式,成功率高达 22%。这意味着可以从需要筛选数千个候选者的实验室,缩减到筛选几十个候选者。这还很早,但我怀疑更好的抗体设计方法将在未来几年对疾病治疗产生重大影响。 • 今天,我们发布了一篇论文,显示“桥接编辑”,这是 Arc 科学家去年首次提出的,可以在长达 100 万个碱基对的人类细胞中进行精确编辑,而无需依赖内在不可预测的细胞修复机制(CRISPR 需要这种机制,常常导致编辑错误)。他们展示了可以使用这种编辑切除导致弗里德里希共济失调(神经系统疾病)的 DNA 重复序列,这种方法对亨廷顿病和其他类似疾病也应相关。一个特别酷的地方是,可以在扩展的编辑窗口内指定每个核苷酸,这意味着递归桥接编辑可能是重新编程由许多基因突变引起的生物特征的强大方法。(目前的基因疗法针对单一突变。) Arc 是相对较新的。它于 2022 年中期开门营业,现在有 300 人。我对这些发现感到兴奋,因为它们表明我们在创办 Arc 时的一些希望开始实现: • AI/ML 和计算处于所有三项发现的中心。这对前两项显然是正确的,但桥接编辑背后的移动遗传元件也是通过复杂的计算搜索发现的。我们创办 Arc 的一个前提是相信软件/AI 和实验室生物学的交集应该能够实现伟大的事情。(而且除了需要大量计算工作外,这三项工作也都需要强大的实验室工作,在一个物理屋檐下紧密协调。) • 我们一直在考虑少数技术如何在生物学中启用一种新的“图灵循环”:测序进展(包括单细胞测序)为我们提供了新的阅读方式;变换器和 AI 为我们提供了新的思考方式;功能基因组学(如桥接编辑)为我们提供了新的写作方式。这三项发现涵盖了这个循环的每个部分,我们希望在改善每个部分时会有复合回报。 • Arc 是一个非营利组织,我们希望这能使与他人的合作变得更容易,因为我们可以避免对财务回报的担忧。这确实证明了重要性,这三项项目都涉及与他人的紧密合作。Germinal 是与斯坦福大学的 @SynBioGaoLab 合作完成的;Evo 2 是与 Nvidia 合作训练的。桥接编辑是与东京大学的 @HNisimasu 实验室共同发布的。Arc 努力使其发现对他人有用(参见 Evo 2 设计者[2]),计算项目背后的代码是开源的,希望能使他人容易发现未来合作和伙伴关系的新机会。最重要的是,Arc 本身是与 @UCSF、@UCBerkeley 和 @Stanford 的持续合作。 • 通过 Arc,我们希望实现更好的自下而上和自上而下的工作。通过我们提供给研究人员的完全灵活、无附加条件的资金,我们希望能够实现完全意想不到的发现和研究途径。通过我们的研究所倡议(围绕创建虚拟细胞和治愈阿尔茨海默病),我们希望带来通常在基础科学中难以实现的规模和协调水平。Germinal 是一个“意外”发现,没有涉及自上而下的协调,而 Evo 2 是雄心勃勃的高层规划和资金的结果。 • 人类从未治愈过复杂疾病(这一类别包括大多数神经退行性疾病、大多数癌症和大多数自身免疫疾病),我希望 Arc 能够帮助改变这一点。显然,AI 将彻底改变生物学,我希望 Arc 能够有效聚合所需的成分,以充分利用其潜力。我有偏见,但我认为世界上最酷的生物学目前正在 Arc 进行。(如果你感兴趣,他们总是在招聘。) 虽然我是 Arc 的联合创始人,但我几乎把所有时间都花在 Stripe 上,我们在这里致力于为互联网构建经济基础设施。所有对 Arc 进展的赞誉都应归功于那些将 Arc 视为家或选择与我们合作的杰出科学家和员工。(你可以在这些线程中阅读更多关于这些特定发现的信息:[3],[4],[5]。)我也非常感谢那些为使 Arc 的持续工作成为可能而努力的出色 Stripe 员工,以及选择与 Stripe 合作的数百万客户。约翰和我感到幸运,能够在我们所能的范围内支持 Arc 的工作。 也许这有些过度解读,但我有时觉得 @arcinstitute 和 @stripe 之间有一种共性。生物学和经济基础设施都涉及对具有许多层次的涌现效应的复杂系统进行推理,在这两种情况下,构建正确的工具都可以带来几乎无限的好处。尽管这两者的进展往往需要很长时间,但在这两者中,接下来的五年似乎将是记忆中最有趣的几年之一。 (如果经济基础设施是你的兴趣,我们在下周的 Stripe Tour 纽约站有一系列精彩的公告。敬请关注!)