Pesquisadores desenvolveram um modelo generativo de inteligência artificial (IA) capaz de projetar novas moléculas para bloquear o SARS-CoV-2, o vírus que causa o Covid-19, de acordo com um estudo publicado na Science Advances na semana passada.
A descoberta de medicamentos costuma ser um processo longo e desafiador, observaram os pesquisadores, principalmente quando a estrutura das proteínas-alvo das drogas e as moléculas ativas não são conhecidas. Por causa disso, o desenvolvimento de novos medicamentos pode levar mais de uma década.
Durante os estágios iniciais da pandemia de Covid-19, equipes de pesquisa em todo o mundo puderam colaborar e desenvolver novos tratamentos para a doença de forma significativamente mais rápida. Isso ocorreu em grande parte devido ao fato de muitos desses medicamentos já terem sido aprovados para outros usos e reaproveitados para o Covid-19.
No entanto, os pesquisadores indicaram que, no futuro, novos medicamentos podem precisar ser desenvolvidos rapidamente para combater futuras pandemias ou abordar mutações de vírus existentes. O vírus da Covid-19 sofreu várias mutações desde o início da pandemia, afirmaram, e algumas das terapias desenvolvidas nessa época não são mais eficazes como resultado.
Isso cria um desafio único para a descoberta de medicamentos, exigindo um método alternativo para descoberta de medicamentos que seja mais rápido e mais adaptável do que os métodos convencionais.
As equipes da Universidade de Oxford, da IBM e da instalação de fonte de luz e síncrotron baseada no Reino Unido, Diamond Light Source, se uniram para desenvolver essa abordagem baseada em IA generativa.
De acordo com uma postagem no blog da IBM discutindo a pesquisa, as equipes levantaram a hipótese de que a capacidade de uma IA de processar grandes quantidades de dados e gerar novos insights permitiria criar moléculas inteiramente novas não encontradas na natureza que poderiam ser usadas para apoiar a descoberta de medicamentos.
Seu modelo, geração controlada de moléculas (CogMol), foi construído em um tipo de arquitetura chamada autoencoders variacionais (VAEs), que codificam dados brutos em um formato compactado e depois os traduzem de volta em uma variação estatística da amostra original, a postagem do blog estados. O modelo foi treinado em um grande conjunto de dados de moléculas representadas como strings de texto, além de informações gerais sobre proteínas e como elas se ligam.
Para tornar o modelo mais geral e capaz de ser implantado para tarefas de design molecular que nunca encontrou, os pesquisadores excluíram intencionalmente as informações sobre o SARS-CoV-2 do conjunto de dados. A partir daí, o modelo foi encarregado de encontrar moléculas semelhantes a medicamentos que se ligassem a dois alvos de proteínas do Covid-19: o pico e a protease principal, responsáveis por transmitir o vírus à célula hospedeira e ajudar a espalhar o vírus.
As estruturas 3D de ambas as proteínas são conhecidas, mas os pesquisadores optaram por usar apenas as sequências de aminoácidos derivadas de seu DNA. Ao fazer isso, os pesquisadores esperavam que o modelo aprendesse a gerar moléculas sem precisar conhecer a forma da proteína-alvo.
Usando essas sequências de aminoácidos, o CogMol gerou 875 mil moléculas candidatas ao longo de três dias. Esses candidatos foram então executados em vários modelos preditivos para reduzir o número de moléculas e determinar quais ingredientes seriam necessários para sintetizá-los.
A partir daí, foram selecionadas 100 moléculas por alvo, e os químicos escolheram as quatro moléculas de cada alvo que seriam mais fáceis de fabricar.
Essas oito moléculas foram então sintetizadas em compostos e testadas em testes de inibição de alvos e neutralização de vírus vivos. Dois deles tinham como alvo a protease principal e outros dois tinham como alvo a proteína spike. Os últimos compostos provaram ser capazes de neutralizar todas as seis principais variantes do Covid-19.
Essas descobertas são importantes, explicaram os pesquisadores, porque a preparação para uma futura pandemia requer a capacidade de desenvolver rapidamente drogas que visam diferentes locais da proteína, que faz parte de como um vírus é neutralizado.
“Criamos antivirais válidos usando um modelo de base geradora que sabia relativamente pouco sobre seus alvos de proteína”, disse o coautor sênior do estudo, Jason Crain, PhD, pesquisador da IBM Research e professor em Oxford, na postagem do blog. “Tenho esperança de que esses métodos nos permitam criar antivirais e outros compostos urgentemente necessários com muito mais rapidez e baixo custo no futuro.”
Agora que a tecnologia para gerar esses compostos foi desenvolvida, os pesquisadores postularam que ela poderia ser usada para enfrentar rapidamente a ameaça de novos vírus.
“Levou tempo para desenvolver e validar esses métodos, mas agora que temos um pipeline funcionando, podemos gerar resultados muito mais rapidamente”, disse o coautor sênior do estudo, Payel Das, PhD, pesquisador da IBM Research. “Quando o próximo vírus surgir, a IA generativa pode ser fundamental na busca de novos tratamentos.”
A pesquisa é um exemplo significativo de como o Covid-19 pode ajudar a refinar a IA na área da saúde.
A pandemia ajudou a esclarecer algumas das maiores deficiências da assistência médica, incluindo esgotamento clínico, lacunas de atendimento e sistemas de TI díspares, forçando a liderança do sistema de saúde a considerar soluções para esses problemas além do Covid-19.
Para muitos, isso significava recorrer a IA e ferramentas de análise de dados para vários casos de uso, incluindo adesão a medicamentos, imagens médicas, gerenciamento de doenças crônicas, suporte a decisões clínicas, tratamento de câncer e medicina de precisão.