Desenvolvida por pesquisadores da Universidade de Stanford e do Arc Institute, em colaboração com a Nvidia, esta inovação aborda o genoma como modelo de linguagem, que permite identificar os padrões, detalhes e estruturas que organizam oADN.

A partir desta base, o Evo2 pode prever o resto de uma sequência e imaginar fragmentos genética não publicado.

Um campeão do DNA

Para alcançar este resultado, o sistema foi treinado usando dados de sequência de nucleotídeos não redundantes validados de bactériasdearquéiadeeucariontes e de bacteriófagoslevando em consideração 40 bilhões de parâmetros.

Ao aprender a probabilidade das sequências – ou seja, a sua probabilidade de serem funcionais – em grandes conjuntos de dados em evolução, o Evo2 pode fazer previsões sem exemplos prévios, ajustes finos ou supervisão específica.

Evo2 é o primeiro modelo de IA que pode gerar sequências de DNA. © AI Vantagem

Poder de computação excepcional

Para atingir tais capacidades, o Evo2 mobiliza um extraordinário poder de computação, composto por mais de 2.000 GPUs Nvidia H100 que, em conjunto, podem realizar 4 mil milhões de mil milhões de operações por segundo.

Além disso, ao combinar três tipos diferentes de operadores convolucionais, sua arquitetura, chamada ListradoHyena2foi projetado para gerenciar sequências muito longas de uma só vez, que podem incluir até um milhão nucleotídeoso que permite levar em conta interações distantes no genoma.

Compreender como o ADN não codificante das nossas células influencia o risco de doenças: um grande desafio para a investigação biológica que a nova inteligência artificial da Google poderá ajudar a resolver. © IQ-Fotografia, Adobe Stock

Etiquetas:

saúde

Google criou IA para ajudar pesquisadores a decifrar o ‘genoma sombrio’

Leia o artigo



Na verdade, no DNA, certos elementos muito distantes uns dos outros na cadeia podem interagir e influenciar a expressão de um envergonhado. Os modelos deIA os mais velhos, que também eram mais limitados, lutaram para compreender essas relações complexas.

Ao ser capaz de levar em conta todas as escalas e elementos, o Evo2 pode compreender tanto os detalhes moleculares quanto a organização geral do genoma.

O primeiro ChatGPT da linguagem genômica

Sendo concebida como um modelo generativo, esta inovação pode produzir novas sequências de DNA usando uma sequência mais curta como ponto de partidada mesma forma que o ChatGPT gera texto em resposta a uma mensagem escrita.

Assim, em testes, o Evo2 foi usado para gerar sequências inteiras de DNA que codificam estruturas celulares complexas chamadas mitocôndriaso que o sistema conseguiu fazer com um mínimo de instruções para começar.

 Descubra como a genética obedece às leis da matemática pura. © Gorenkoff, iStock

Etiquetas:

saúde

Equações escondidas no DNA: a genética fala em linguagem matemática

Leia o artigo



No futuro, esta inovação poderá prever o impacto funcional das variantes genéticas, incluindo mutações patógenos não-codificação, projetar genomas sintéticos e vincular sequências a prováveis ​​funções biológicas, o que constituiria um grande avanço na matéria de biologia computacional.

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *