Como o AlphaFold está acelerando a pesquisa em todos os campos da biologia?

Alhafold BiologyLeave a Comment on Como o AlphaFold está acelerando a pesquisa em todos os campos da biologia?

Como o AlphaFold está acelerando a pesquisa em todos os campos da biologia?

Ao resolver um desafio científico de décadas, o nosso sistema de IA está a ajudar a resolver problemas cruciais, como tratamentos para doenças ou a degradação de plásticos descartáveis. Um dia, poderá até ajudar a desvendar os mistérios de como a própria vida funciona.

Atualmente, existem mais de 200 milhões de proteínas conhecidas, e muitas mais são encontradas a cada ano. Cada um tem uma forma 3D única que determina como funciona e o que faz.

Mas descobrir a estrutura exata de uma proteína às vezes pode levar anos e milhões de dólares, o que significa que os cientistas só conseguiram estudar uma pequena fração delas. Isso retardou a pesquisa para combater doenças e encontrar novos medicamentos.

Visualização de quantos aminoácidos compõem uma proteína e quantas proteínas são encontradas no corpo humano e na Terra

O problema do dobramento de proteínas

Se você pudesse desvendar uma proteína, veria que ela é como um colar de contas feito de uma sequência de diferentes substâncias químicas conhecidas como aminoácidos.

Estas sequências são montadas de acordo com as instruções genéticas do DNA de um organismo.

A atração e a repulsão entre os 20 tipos diferentes de aminoácidos fazem com que o barbante se dobre numa façanha de “origami espontâneo”. Isso forma os intrincados cachos, voltas e pregas da estrutura 3D de uma proteína.

Durante décadas, os cientistas tentaram encontrar um método para determinar com segurança a estrutura de uma proteína apenas a partir da sua sequência de aminoácidos. Esses métodos incluíam ressonância magnética nuclear e cristalografia de raios X – que dependiam de extensas tentativas e erros, anos de trabalho meticuloso e equipamentos especializados multimilionários.

Este grande desafio científico é conhecido como o problema do enovelamento de proteínas.

Visualização de uma chave que desbloqueia o problema do enovelamento de proteínas

A solução AlphaFold

Levamos quatro anos para resolver o problema do enovelamento de proteínas. Começamos a trabalhar em 2016, quase imediatamente após a vitória do AlphaGo contra Lee Sedol.

AlphaFold foi ensinado mostrando as sequências e estruturas de cerca de 100.000 proteínas conhecidas.

Agora ele pode prever a forma de uma proteína, quase instantaneamente, com precisão atômica.

AlphaFold foi reconhecido como uma solução para o grande desafio do enovelamento de proteínas pela CASP (Avaliação Crítica da Previsão da Estrutura de Proteínas), uma comunidade para pesquisadores compartilharem o progresso em suas previsões em relação a dados experimentais reais.

O CASP organiza um desafio bienal para grupos de pesquisa testarem a precisão de suas previsões em relação a dados experimentais reais.

As equipes recebem uma seleção de sequências de aminoácidos para proteínas que tiveram sua forma exata mapeada em 3D – mas ainda não foram lançadas em domínio público. As equipes devem enviar suas melhores previsões para ver o quão próximas estão das estruturas reveladas posteriormente.

No CASP13 (em 2018), AlphaFold ficou em primeiro lugar. No CASP 14 (em 2020), apresentamos nossa versão mais recente do AlphaFold – que apresentou um nível de precisão tão alto que a comunidade considerou o problema do enovelamento de proteínas resolvido.

Desde então, o artigo sobre métodos AlphaFold recebeu mais de 10.000 citações. Isso o coloca entre os 100 artigos mais citados da última década e entre os 900 artigos mais citados de todos os tempos.

Gratuito para todos

Disponibilizamos gratuitamente as previsões do AlphaFold para qualquer pessoa da comunidade científica.

Fizemos isso através do banco de dados de estruturas de proteínas AlphaFold, em parceria com o Instituto Europeu de Bioinformática do EMBL – o principal laboratório de ciências da vida na Europa. A base de dados baseia-se em décadas de trabalho meticuloso realizado por cientistas, utilizando métodos tradicionais para determinar a estrutura das proteínas.

Nosso primeiro lançamento – em 22 de julho de 2021 – cobriu mais de 350.000 estruturas, incluindo o proteoma humano. Isso representa todas as cerca de 20 mil proteínas conhecidas expressas no corpo humano, juntamente com os proteomas de 20 organismos adicionais importantes para a pesquisa biológica, incluindo a levedura, a mosca da fruta e o camundongo.

A proportional circle chart showing the number of protein structures. AlphaFold DB today in dark blue forms the largest circle, representing over 200 million structures. A smaller light blue circle towards the bottom of the main circle represents AlphaFold DB previously, which was around 1 million structures. Within that circle, a smaller purple one represents Experimental (PDB) today, made up of 190,000 structures.

Estes organismos são fundamentais para a investigação biológica moderna, incluindo descobertas vencedoras do Prémio Nobel, como a descoberta da insulina e o desenvolvimento de medicamentos que salvam vidas.

Este lançamento expandiu dramaticamente nosso conhecimento sobre estruturas proteicas. Mais do que dobrou o número de estruturas de proteínas humanas de alta precisão disponíveis para os cientistas.

Em 28 de julho de 2022, expandimos esta base de dados de quase um milhão de estruturas para mais de 200 milhões de estruturas – incluindo quase todas as proteínas catalogadas conhecidas pela ciência.

Já foi acessado por mais de um milhão de usuários em mais de 190 países.

“Este será um dos conjuntos de dados mais importantes desde o mapeamento do Genoma Humano”

EWAN BIRNEY
DIRETOR GERAL ADJUNTO DO EMBL E DIRETOR DO EMBL-EBI

Acelerando a descoberta científica

Nossos parceiros já estão usando o AlphaFold e o banco de dados de estrutura de proteínas AlphaFold para acelerar o progresso em problemas importantes do mundo real, incluindo a decomposição de plásticos descartáveis , a resolução de quebra-cabeças biológicos e a descoberta de novos medicamentos para tratar o câncer de fígado . Ao reduzir a necessidade de experiências lentas e dispendiosas, a AlphaFold poupou potencialmente ao mundo da investigação até mil milhões de anos de progresso – e biliões de dólares.

Um quarto das pesquisas que utilizam o AlphaFold está relacionada à compreensão e ao combate a doenças que causam milhões de mortes em todo o mundo.

A iniciativa Medicamentos para Doenças Negligenciadas (DNDi) está avançando na descoberta de medicamentos para doenças negligenciadas, como a doença de Chagas e a leishmaniose. Estas doenças afectam milhões de pessoas em comunidades pobres e vulneráveis.

Uma equipa da Universidade de Cambridge está a utilizar o AlphaFold para procurar uma vacina mais eficaz contra a malária , enquanto na Universidade do Colorado, em Boulder, outra equipa está a estudar a resistência aos antibióticos – um problema que causa 2,8 milhões de infecções só nos EUA todos os anos.

Seis designs de previsões AlphaFold referenciados em publicações. Cada um tem uma breve descrição abaixo. São os seguintes: Proteína do complexo de poros nucleares Nup205. Parte de um grande complexo que atua como porta de entrada e saída do núcleo da célula. Proteína de superfície de gametócitos P45/48. Do parasita da malária; uma proteína candidata para inclusão em vacinas. Subunidade 9 do complexo de transcrição CCR4 – NOT. Regula um importante processo celular (a taxa de degradação do MRNA). Proteína de nucleação de gelo. Proteína bacteriana que pode desencadear a formação de gelo em temperaturas relativamente altas, causando danos às plantas pelas geadas. Proteína F2OH23.2. Proteína vegetal; representa uma potencial nova superfamília estrutural diferente de tudo visto antes. Vitelogenina. Envolvido no sistema imunológico de animais que põem ovos, incluindo abelhas.

O que levamos meses e anos para fazer, AlphaFold conseguiu fazer em um fim de semana.

PROFESSOR JOHN MCGEEHAN
PROFESSOR DE BIOLOGIA ESTRUTURAL E DIRETOR DO CENTRO DE INOVAÇÃO ENZIMÁTICA (CEI) DA UNIVERSIDADE DE PORTSMOUTH

Leave a Reply

Your email address will not be published. Required fields are marked *

Back To Top