Algoritmos robustos como aqueles utilizados pela Netflix, Amazon e Facebook podem ‘predizer’ a linguagem biológica do câncer e de doenças neurodegenerativas como Alzheimer e Mal de Parkinson. Essa é a conclusão que cientistas e acadêmicos da St John’s College, na Universidade de Cambridge, chegaram: a tecnologia de aprendizado de máquina pode decifrar a “linguagem biológica” dessas doenças. E, no futuro, poderá corrigir “erros gramaticais” dentro das células que causam doenças.
O estudo foi publicado na revista científica PNAS no dia 8 de abril. Tuomas Knowles, autor principal e membro do St John’s College, disse que, “trazer a tecnologia de aprendizado de máquina para a pesquisa de doenças neurodegenerativas e do câncer é uma completa virada de jogo. Em última análise, o objetivo será usar a inteligência artificial para desenvolver drogas direcionadas para aliviar drasticamente sintomas ou prevenir a demência.”
Entenda o estudo
Dados (big data) que produzidos ao longo de décadas de pesquisa foram alimentados em um modelo de linguagem de computador para avaliar se a inteligência artificial poderia fazer descobertas mais avançadas do que nós humanos.
Cada vez que a Netflix recomenda uma série ou o Facebook sugere alguém para uma possível amizade, estas plataformas estão usando algoritmos de aprendizado de máquina para fazer suposições fundamentadas. Dra. Kadi Liis Saar, também autora do artigo e pesquisadora do St John’s College, usou tecnologia semelhante para treinar um modelo de linguagem de grande escala para entender o que poderia acontecer quando algo dá errado com as proteínas dentro do corpo e que poderiam causar doenças. “O corpo humano é o lar de milhares e milhares de proteínas e os cientistas ainda desconhecem a função de muitas delas. Nós pedimos a um modelo de linguagem baseado em rede neural para aprender a linguagem dessas proteínas”, explica.
Especificamente, nós pedimos ao programa que aprendesse a linguagem dos condensados biomoleculares que mudam de forma – gotículas de proteínas encontradas nas células – aquela que os cientistas realmente precisam entender para decifrar a linguagem da função biológica e do mau funcionamento que causam câncer e doenças neurodegenerativas como Alzheimer. Descobrimos que o programa poderia aprender – sem ser algo dito explicitamente – aquilo que os cientistas já descobriram sobre a linguagem das proteínas ao longo de décadas de pesquisa.” – Dra. Kadi Liis Saar
Proteínas são moléculas grandes e complexas que desempenham funções críticas no corpo. Elas fazem a maior parte do trabalho nas células e são necessárias para a estrutura, função e regulação dos tecidos e órgãos do corpo – anticorpos, por exemplo, são uma proteína que protegem o corpo.
Alzheimer, Parkinson e Huntington são algumas das doenças neurodegenerativas mais comuns, mas os cientistas acreditam que devam existir centenas delas. No caso do Alzheimer, que afeta 50 milhões de pessoas no mundo todo e que deve aumentar para 152 milhões até 2050, as proteínas se deterioram, formam aglomerados, matando as células nervosas saudáveis. Um cérebro saudável tem um sistema de controle de qualidade que efetivamente descarta essas massas potencialmente perigosas de proteínas, conhecidas como agregados proteicos.
Cientistas estão mapeando se algumas proteínas desordenadas também formam gotículas semelhantes ao líquido de proteínas chamado de condensados, os quais não possuem membrana e se fundem livremente umas com as outras. Ao contrário dos agregados proteicos, que são irreversíveis, os condensados proteicos podem se formar e se reformar.
Imagem de microscopia de fluorescência de condensados de proteínas se formando dentro das células vivas. (Crédito: Weitz lab, Harvard University)
“Condensados proteicos recentemente atraíram uma forte atenção no mundo científico porque controlam eventos-chave na célula, como a expressão gênica – como nosso DNA é convertido em proteínas – e a síntese de proteínas – como as células produzem proteínas” afirma professor Knowles.
“Quaisquer defeitos relacionados a essas gotículas de proteína podem levar a doenças como o câncer. É por isso que trazer a tecnologia de processamento da linguagem natural para a pesquisa das origens moleculares do mau funcionamento das proteínas é vital se quisermos corrigir erros dentro das células que causam doenças.” – Professor Tuomas Knowles.
Dra. Saar explica que ela e sua equipe alimentaram o algoritmo com todos os dados contidos nas proteínas para que pudesse aprender e prever a linguagem delas [proteínas] da mesma forma que esses modelos aprendem a linguagem humana e da mesma forma que o WhatsApp sugere palavras quando você escreve uma mensagem. “Perguntamos sobre a gramática específica que leva apenas algumas proteínas a formar condensados dentro das células. É um problema imensamente desafiador e resolvê-lo nos ajudará a aprender as regras da linguagem de doenças”, complementa.
A tecnologia de aprendizado de máquina que está se desenvolvendo em ritmo acelerado devido à crescente disponibilidade de dados, maior poder de computação e avanços que criaram algoritmos mais poderosos, pode acelerar futuras pesquisas sobre câncer e doenças neurodegenerativas, além do que os cientistas já sabem e especulam sobre essas doenças. Dra. Saar explica: “O aprendizado de máquina extrapola a limitação dos pesquisadores e isso significará que novas conexões serão encontradas as quais ainda não concebemos. É realmente algo muito empolgante.”
Fontes: Medical Xpress e Science Daily
Ilustração: Vuyi Chaza