Desenvolvida por pesquisadores da Universidade de Stanford e do Arc Institute, em colaboração com a Nvidia, esta inovação aborda o genoma como modelo de linguagem, que permite identificar os padrões, detalhes e estruturas que organizam oADN.
A partir desta base, o Evo2 pode prever o resto de uma sequência e imaginar fragmentos genética não publicado.
Um campeão do DNA
Para alcançar este resultado, o sistema foi treinado usando dados de sequência de nucleotídeos não redundantes validados de bactériasdearquéiadeeucariontes e de bacteriófagoslevando em consideração 40 bilhões de parâmetros.
Ao aprender a probabilidade das sequências – ou seja, a sua probabilidade de serem funcionais – em grandes conjuntos de dados em evolução, o Evo2 pode fazer previsões sem exemplos prévios, ajustes finos ou supervisão específica.
Poder de computação excepcional
Para atingir tais capacidades, o Evo2 mobiliza um extraordinário poder de computação, composto por mais de 2.000 GPUs Nvidia H100 que, em conjunto, podem realizar 4 mil milhões de mil milhões de operações por segundo.
Além disso, ao combinar três tipos diferentes de operadores convolucionais, sua arquitetura, chamada ListradoHyena2foi projetado para gerenciar sequências muito longas de uma só vez, que podem incluir até um milhão nucleotídeoso que permite levar em conta interações distantes no genoma.

Etiquetas:
saúde
Google criou IA para ajudar pesquisadores a decifrar o ‘genoma sombrio’
Leia o artigo
Na verdade, no DNA, certos elementos muito distantes uns dos outros na cadeia podem interagir e influenciar a expressão de um envergonhado. Os modelos deIA os mais velhos, que também eram mais limitados, lutaram para compreender essas relações complexas.
Ao ser capaz de levar em conta todas as escalas e elementos, o Evo2 pode compreender tanto os detalhes moleculares quanto a organização geral do genoma.
O primeiro ChatGPT da linguagem genômica
Sendo concebida como um modelo generativo, esta inovação pode produzir novas sequências de DNA usando uma sequência mais curta como ponto de partidada mesma forma que o ChatGPT gera texto em resposta a uma mensagem escrita.
Assim, em testes, o Evo2 foi usado para gerar sequências inteiras de DNA que codificam estruturas celulares complexas chamadas mitocôndriaso que o sistema conseguiu fazer com um mínimo de instruções para começar.

Etiquetas:
saúde
Equações escondidas no DNA: a genética fala em linguagem matemática
Leia o artigo
No futuro, esta inovação poderá prever o impacto funcional das variantes genéticas, incluindo mutações patógenos não-codificação, projetar genomas sintéticos e vincular sequências a prováveis funções biológicas, o que constituiria um grande avanço na matéria de biologia computacional.