Na última semana, @arcinstitute publicou três novas descobertas das quais estou muito orgulhoso. • Os primeiros genomas funcionais gerados por IA do mundo. Usando o Evo 2 (o maior modelo de ML em biologia já treinado, que a Arc lançou em parceria com a @nvidia em fevereiro), os cientistas da Arc aproveitaram o fato de que o Evo 2 é um modelo generativo para produzir sequências completamente novas para genomas de fagos completos. Ou seja, eles usaram IA para produzir genomas totalmente novos, nunca antes vistos pela natureza. Eles sintetizaram experimentalmente esses genomas e mostraram que esses fagos gerados por IA realmente funcionam, matando bactérias E. coli com alta eficácia. • Germinal, um sistema de IA para criar novos anticorpos. O design de anticorpos é um dos grandes problemas da biologia médica, dada a sua óbvia importância e utilidade para a criação de terapias. (Os anticorpos são pequenas partículas que ajudam o sistema imunológico a identificar patógenos e outros intrusos nocivos. Veja também o recente artigo Works in Progress sobre este tópico: [1].) Hoje, projetar anticorpos eficazes é muito caro e demorado. Germinal é uma maneira barata e rápida de produzir candidatos a medicamentos, com taxas de sucesso de até 22%. Isso significa que é possível passar de ter que selecionar milhares de candidatos no laboratório para selecionar talvez algumas dezenas. É cedo, mas suspeito que melhores métodos para projetar anticorpos serão um grande avanço para o tratamento de doenças nos próximos anos. • Hoje, publicamos um artigo mostrando que a "edição de ponte", que os cientistas da Arc introduziram pela primeira vez no ano passado, pode fazer edições precisas em células humanas que têm até 1 milhão de pares de bases de comprimento, e sem depender de maquinário de reparo celular intrinsecamente imprevisível (que o CRISPR requer, levando muitas vezes a erros de edição). Eles mostraram que é possível usar essa edição para cortar as repetições de DNA que causam a ataxia de Friedreich (uma doença neurológica), uma abordagem que também deve ser relevante para a doença de Huntington e outros distúrbios semelhantes. Uma coisa particularmente interessante sobre isso é que é possível especificar cada nucleotídeo dentro da janela de edição estendida, o que significa que edições de ponte recursivas poderiam potencialmente ser uma maneira poderosa de reprogramar até mesmo traços biológicos causados por muitas mutações genéticas. (As terapias genéticas hoje visam mutações únicas.) A Arc é bastante nova. Suas portas abriram em meados de 2022, e agora conta com 300 pessoas. Estou animado com essas descobertas porque mostram que várias de nossas esperanças ao iniciar a Arc estão começando a se concretizar: • A IA/ML e a computação estão no centro de todas as três. Isso é obviamente verdade para as duas primeiras, mas o elemento genético móvel por trás da edição de ponte também foi descoberto como resultado de uma busca computacional complexa. Uma de nossas premissas ao iniciar a Arc era a crença de que a interseção entre software/IA e biologia experimental em laboratório úmido deveria possibilitar grandes coisas. (E além de exigir um grande trabalho computacional, todas essas três também exigiram um forte trabalho em laboratório úmido, coordenado de forma estreita sob um único teto físico.) • Temos brincado com a ideia de que um punhado de tecnologias está possibilitando um novo tipo de "loop de Turing" na biologia: os avanços em sequenciamento (incluindo sequenciamento de célula única) nos dão novas maneiras de ler; transformadores e IA nos dão novas maneiras de pensar; e a genômica funcional (como a edição de ponte) nos dá novas maneiras de escrever. Este trio de descobertas abrange cada parte desse loop, e estamos esperançosos de que haverá retornos acumulativos na melhoria de cada parte. • A Arc é uma organização sem fins lucrativos, o que esperávamos que tornasse a colaboração com outros mais fácil, já que podemos evitar preocupações sobre retorno financeiro. Isso está se mostrando importante, e todos esses três projetos envolveram uma parceria próxima com outros. Germinal foi feito em parceria com o @SynBioGaoLab em Stanford; o Evo 2 foi treinado em parceria com a Nvidia. A edição de ponte foi publicada em conjunto com uma estrutura do @HNisimasu Lab na Universidade de Tóquio. A Arc tenta tornar suas descobertas úteis (veja o Designer do Evo 2[2]) para outros, e o código por trás dos projetos computacionais é de código aberto, esperamos facilitando para outros identificarem novas oportunidades de colaboração e parceria no futuro. Acima de tudo, a Arc em si é uma colaboração contínua com @UCSF, @UCBerkeley e @Stanford. • Com a Arc, queríamos possibilitar um trabalho melhor de baixo para cima e de cima para baixo. Com o financiamento totalmente flexível e sem amarras que fornecemos aos investigadores, queremos possibilitar descobertas e avenidas de investigação completamente inesperadas. Com nossas iniciativas institucionais (em torno da criação de uma célula virtual e cura do Alzheimer), queremos trazer à tona uma escala e um nível de coordenação que geralmente são difíceis na ciência básica. Germinal é uma descoberta "surpresa" que não envolveu coordenação de cima para baixo, enquanto o Evo 2 é o resultado de um planejamento e financiamento ambiciosos de alto nível. • A humanidade nunca curou uma doença complexa (uma categoria que inclui a maioria das doenças neurodegenerativas, a maioria dos cânceres e a maioria das doenças autoimunes), e minha esperança é que a Arc possa ajudar a mudar isso. Também está claro que a IA revolucionará a biologia, e espero que a Arc possa agregar efetivamente os ingredientes necessários para capitalizar totalmente sua promessa. Estou tendencioso, mas acho que algumas das biologias mais legais do mundo estão sendo feitas atualmente na Arc. (Eles estão sempre contratando se você estiver interessado.) Embora eu seja cofundador da Arc, passo quase todo o meu tempo na Stripe, onde passamos nosso tempo construindo infraestrutura econômica para a internet. Todo o crédito pelo progresso da Arc deve ir para os notáveis cientistas e funcionários que fizeram da Arc seu lar ou que escolheram colaborar conosco. (Você pode ler mais sobre essas descobertas particulares nestes tópicos: [3], [4], [5].) Também sou muito grato aos incríveis funcionários da Stripe que construíram a empresa que torna o trabalho contínuo da Arc possível, e aos milhões de clientes que escolheram se associar à Stripe. John e eu nos sentimos sortudos por poder apoiar o trabalho da Arc na medida em que fazemos. Talvez isso seja ler demais, mas às vezes sinto que há uma afinidade entre @arcinstitute e @stripe. Tanto a biologia quanto a infraestrutura econômica envolvem raciocínio sobre sistemas complexos com muitos níveis de efeitos emergentes, e em ambos os casos, construir as ferramentas certas pode ter benefícios quase ilimitados. Embora o progresso em ambos os casos tenda a levar muito tempo, também parece que os próximos cinco anos em ambos serão alguns dos mais interessantes da memória viva. (Se infraestrutura econômica é a sua praia, temos uma série de anúncios fantásticos chegando na Stripe Tour em Nova York na próxima semana. Fique ligado!)