Novo modelo de IA consegue desenvolver proteínas que não existem na natureza, mas que são capazes de realizar funções biológicas
A inteligência artificial está sendo adotada pela medicina e pode promover verdadeiras revoluções. Uma delas é o desenvolvimento de proteínas que não existem na natureza, mas que são capazes de realizar funções biológicas.
Banco de dados da IA conta com 2,78 bilhões de proteínas
Para atingir este objetivo, pesquisadores criaram um modelo de IA.
Chamado ESM, ele é uma espécie de ChatGPT, da OpenAI.
A tecnologia foi usada pela EvolutionaryScale, empresa formada por ex-funcionários da Meta, dona do Facebook.
O software foi alimentado com 2,78 bilhões de proteínas diferentes, com dados incluindo a sequência de aminoácidos que formam cada uma, a estrutura em formato 3D da proteína e função dela.
Os resultados foram descritos em um estudo publicado no bioRxiv.
Processo é muito mais rápido do que mapear estruturas proteicas
Para criar o modelo de linguagem, os pesquisadores esconderam porções aleatórias de informação sobre cada proteína e pediram que a IA previsse como seriam as partes faltantes.
Segundo cientistas, este processo tem certas limitações. No entanto, é muito mais rápido do que usar raios-x para mapear estruturas proteicas uma por uma e completar os dados ainda desconhecidos.
O ESM3 é capaz de usar as informações sobre as proteínas de seus bancos de dados para criar novas moléculas com funções específicas. Uma delas era a fluorescência, cujo efeito é gerado quando uma proteína consegue capturar luz e liberá-la em uma frequência de onda mais alta, liberando um brilho esverdeado.
A IA conseguiu gerar 96 candidatas para a função. Os cientistas, então, selecionaram algumas delas para comprovar que realmente funcionavam como o esperado.
Embora a proteína artificial gere um brilho 50 vezes mais fraco do que as naturais, o modelo conseguiu criar uma estrutura diferente de qualquer uma encontrada na natureza. Ela recebeu o nome de esmGPF.
Por Alessandro Di Lorenzo do Olhar Digital