Em 2003, quando o genoma humano foi finalmente sequenciado, os cientistas comemoraram como se tivessem aberto o “livro da vida”. Duas décadas depois, ficou claro que possuir o texto não significa compreendê-lo. Agora, uma nova inteligência artificial quer dar o próximo passo: aprender a gramática que governa esse livro. É essa a ambição do AlphaGenome, modelo recém-apresentado pelo Google DeepMind, que busca revelar como vastas regiões do DNA regulam a vida celular.
Do livro da vida à sua gramática invisível
Dos cerca de 3 bilhões de pares de nucleotídeos que formam o DNA humano, apenas 2% codificam diretamente proteínas. O restante — impressionantes 98% — atua como um maestro silencioso: decide quando, onde e em que intensidade cada gene deve se manifestar.
Essas regiões “não codificantes” sempre foram um desafio. Elas concentram muitas variantes associadas a doenças, mas seu funcionamento é difícil de interpretar. Segundo Pushmeet Kohli, vice-presidente de pesquisa do Google DeepMind, já temos o texto completo do genoma — falta entender como ele organiza a vida. A apresentação oficial do AlphaGenome foi publicada na Nature.
É justamente aí que entra a nova IA: mapear como pequenas mudanças no DNA influenciam processos celulares fundamentais.
O que torna o AlphaGenome diferente
Our breakthrough AI model AlphaGenome is helping scientists understand our DNA, predict the molecular impact of genetic changes, and drive new biological discoveries. 🧬
Find out more in @Nature ↓ https://t.co/jvBLRXYzdj pic.twitter.com/WEL4Ptdv06
— Google DeepMind (@GoogleDeepMind) January 28, 2026
O AlphaGenome se soma a uma família de modelos já conhecidos do laboratório, como AlphaFold (que revolucionou a previsão de estruturas de proteínas), AlphaMissense e AlphaProteo. A diferença é o foco: em vez de proteínas, ele se dedica à regulação genética.
Treinado com dados de grandes consórcios públicos — obtidos a partir de centenas de tipos de células e tecidos humanos e de camundongos — o modelo usa aprendizado profundo para analisar sequências longuíssimas de DNA, chegando a até um milhão de pares de nucleotídeos de uma vez.
Isso é crucial porque, como explica Ziga Avsec, um dos autores do projeto, só sequências extensas permitem capturar todo o ambiente regulatório de um gene. Ao mesmo tempo, o AlphaGenome mantém resolução suficiente para avaliar o impacto de mutações específicas, comparando versões alteradas e não alteradas do DNA.
Outro avanço importante: a ferramenta modela simultaneamente a influência da sequência genética sobre 11 processos biológicos diferentes. Até agora, pesquisadores precisavam recorrer a vários modelos separados para obter esse tipo de visão integrada.
Um acelerador para a pesquisa de doenças
Na prática, o AlphaGenome pode ajudar a localizar elementos funcionais no genoma e esclarecer seus papéis em nível molecular. Para Natasha Latysheva, também coautora do estudo, isso abre caminho para compreender melhor como variantes genéticas contribuem para enfermidades complexas.
O modelo já foi testado por cerca de 3 mil cientistas em 160 países e está sendo disponibilizado em código aberto para uso acadêmico. A expectativa é que a comunidade o enriqueça com novos dados e abordagens.
Para Ben Lehner, responsável por genômica generativa e sintética no Wellcome Sanger Institute, identificar com precisão quais diferenças genéticas aumentam ou reduzem o risco de milhares de doenças é um passo decisivo rumo a tratamentos mais eficazes. Ele considera o sistema muito promissor, embora ainda longe da perfeição.
Limites reais, impacto potencial enorme
Como todo modelo de IA, o AlphaGenome depende fortemente da qualidade dos dados de treinamento — que ainda são limitados e pouco padronizados em muitas áreas. Além disso, a expressão dos genes não é determinada apenas pelo DNA: fatores ambientais complexos também entram em jogo.
Robert Goldstone, do Francis Crick Institute, ressalta que a ferramenta não é uma solução mágica para todos os enigmas da biologia. Ainda assim, ele acredita que permitirá estudar e simular, de forma programática, as bases genéticas de doenças multifatoriais.
Um novo capítulo na leitura do genoma

Se AlphaFold mostrou como a IA pode desvendar a forma das proteínas, o AlphaGenome tenta ir além: explicar como o próprio genoma se organiza e se regula. Ao transformar regiões antes opacas do DNA em previsões mensuráveis, o modelo oferece aos cientistas uma lente inédita sobre a biologia humana.
Ainda é cedo para falar em aplicações clínicas diretas. Mas, ao ensinar máquinas a ler a gramática da vida, o Google DeepMind aproxima a pesquisa de um objetivo antigo: compreender não apenas o que está escrito em nosso DNA, mas como essa escrita ganha significado dentro das células. É um passo silencioso — porém profundo — rumo a uma medicina mais precisa e a uma nova era na genômica.
[ Fonte: DW ]