165 novos genes de câncer identificados usando aprendizado de máquina

Genes previamente desconhecidos

Novo algoritmo pode prever quais genes causarão câncer, mesmo que

a sequência do DNA não mudou.Uma equipa de investigadores em Berlim combinou vários dados e analisou-os utilizando “inteligência artificial” para identificar um grande número de oncogenes. Isto abre novas perspectivas no desenvolvimento de tratamentos direcionados ao câncer e biomarcadores na medicina personalizada.

No câncer, as células se multiplicam e invadem os tecidos,destruindo órgãos e, assim, interrompendo suas funções vitais. O crescimento ilimitado geralmente é causado pelo acúmulo de alterações no DNA nos oncogenes, mutações nesses genes que controlam o desenvolvimento celular. No entanto, alguns cânceres têm muito poucos genes mutantes. Isso significa que outras causas levam a uma doença perigosa.

Um grupo de pesquisadores do Instituto de MolecularO Instituto Max Planck de Genética (MPIMG) em Berlim e o Instituto de Biologia Computacional em Helmholtz usam métodos de aprendizado de máquina para identificar 165 genes de câncer até então desconhecidos. Os pesquisadores usam um algoritmo especial para analisar os dados.

A sequência desses genes é opcionalmudança. É óbvio que uma violação de seu regulamento já pode levar ao câncer. Todos os genes identificados recentemente interagem intimamente com oncogenes bem conhecidos. Eles são necessários para a sobrevivência das células tumorais, mostraram experimentos em culturas de células.

Metas adicionais para medicina personalizada

Um algoritmo chamado EMOGI em ExplainableMulti-Omics Graph Integration também pode explicar a relação entre os mecanismos celulares que transformam um gene em um oncogene. Como um grupo de pesquisadores liderado por Annalisa Marsico explica na revista Nature Machine Intelligence, o software reúne dezenas de milhares de conjuntos de dados criados a partir de amostras de pacientes. Isso inclui informações sobre a metilação do DNA, a atividade de genes individuais e interações de proteínas dentro da via celular, bem como dados sobre sequências com mutações. Nestes dados, algoritmos de aprendizado profundo descobrem os padrões e princípios moleculares que levam ao desenvolvimento do câncer.

Em contraste com os métodos tradicionaistratamentos de câncer, como quimioterapia, os tratamentos individuais são adaptados ao tipo específico de tumor. “Nosso objetivo é escolher o melhor tratamento para cada paciente, o tratamento mais eficaz e com menos efeitos colaterais. Além disso, as propriedades moleculares podem ser usadas para detectar o câncer que já está em estágio inicial”, explica Marsico, chefe do grupo de pesquisa do MPIMG.

“Somente conhecendo a causa da doença podemos efetivamente neutralizá-la ou corrigi-la”, escreveram os pesquisadores. "É por isso que é tão importante identificar o maior número possível de mecanismos causadores de câncer."

Melhores resultados com uma combinação

“Hoje, a maioria“A pesquisa concentra-se em alterações de sequências patogênicas ou padrões celulares”, disse Roman Schulte-Sasse, estudante de doutorado da equipe de Marsico e primeiro autor da publicação. “Ao mesmo tempo, tornou-se recentemente claro que distúrbios epigenéticos ou desregulação da atividade genética também podem levar ao cancro”.

É por isso que os pesquisadores reuniram os dados.Sequências que representam falhas de circuito, com informações que representam eventos nas células. Os cientistas confirmaram inicialmente que as mutações ou proliferação de segmentos genômicos são, na verdade, a principal causa do câncer. Então, em uma segunda etapa, identificamos genes candidatos que não estão diretamente relacionados aos genes que realmente causam o câncer.

“Por exemplo, descobrimos um gene no câncer“que tem pouca alteração de sequência, mas regula o fornecimento de energia e é necessário para tumores”, diz Schulte-Sass. “Esses genes não podem ser controlados por outros meios. Por exemplo, é causada por alterações químicas no DNA, como a metilação. Estas alterações não afetam a informação da sequência, mas dominam a atividade do gene. Esses genes são alvos promissores para a descoberta de medicamentos, mas como funcionam em segundo plano, só podem ser encontrados usando algoritmos complexos”.

Mais pesquisa

O novo programa de pesquisa acrescenta muitonovas entradas na lista de oncogenes suspeitos. Só nos últimos anos, cresceu de 700 para 1.000. Os investigadores apenas rastrearam genes ocultos utilizando uma combinação de análise bioinformática e técnicas modernas de inteligência artificial (IA).

Existem muitos outros detalhes interessantes ocultos nos dados.“Vemos muitos padrões consistentes com o câncer”, diz Marsico. “Acho que esta é uma evidência de que os tumores são causados ​​por diferentes mecanismos moleculares em diferentes órgãos.”

Os pesquisadores enfatizam que o programa EMOGInão se limita ao câncer. Em teoria, poderia ser usado para integrar diferentes conjuntos de dados biológicos e encontrar padrões. Os algoritmos são aplicáveis ​​a doenças complexas semelhantes.

Consulte Mais informação

O primeiro mapa preciso do mundo foi criado. O que há de errado com todo mundo?

A radiação infravermelha de mãos humanas foi usada para criptografar

Urano recebeu o status de planeta mais estranho do sistema solar. Porque?