Ao resolver um desafio científico de décadas, o nosso sistema de IA está a ajudar a resolver problemas cruciais, como tratamentos para doenças ou a degradação de plásticos descartáveis. Um dia, poderá até ajudar a desvendar os mistérios de como a própria vida funciona.
Atualmente, existem mais de 200 milhões de proteínas conhecidas, e muitas mais são encontradas a cada ano. Cada um tem uma forma 3D única que determina como funciona e o que faz.
Mas descobrir a estrutura exata de uma proteína às vezes pode levar anos e milhões de dólares, o que significa que os cientistas só conseguiram estudar uma pequena fração delas. Isso retardou a pesquisa para combater doenças e encontrar novos medicamentos.
O problema do dobramento de proteínas
Se você pudesse desvendar uma proteína, veria que ela é como um colar de contas feito de uma sequência de diferentes substâncias químicas conhecidas como aminoácidos.
Estas sequências são montadas de acordo com as instruções genéticas do DNA de um organismo.
A atração e a repulsão entre os 20 tipos diferentes de aminoácidos fazem com que o barbante se dobre numa façanha de “origami espontâneo”. Isso forma os intrincados cachos, voltas e pregas da estrutura 3D de uma proteína.
Durante décadas, os cientistas tentaram encontrar um método para determinar com segurança a estrutura de uma proteína apenas a partir da sua sequência de aminoácidos. Esses métodos incluíam ressonância magnética nuclear e cristalografia de raios X – que dependiam de extensas tentativas e erros, anos de trabalho meticuloso e equipamentos especializados multimilionários.
Este grande desafio científico é conhecido como o problema do enovelamento de proteínas.
A solução AlphaFold
Levamos quatro anos para resolver o problema do enovelamento de proteínas. Começamos a trabalhar em 2016, quase imediatamente após a vitória do AlphaGo contra Lee Sedol.
AlphaFold foi ensinado mostrando as sequências e estruturas de cerca de 100.000 proteínas conhecidas.
Agora ele pode prever a forma de uma proteína, quase instantaneamente, com precisão atômica.
AlphaFold foi reconhecido como uma solução para o grande desafio do enovelamento de proteínas pela CASP (Avaliação Crítica da Previsão da Estrutura de Proteínas), uma comunidade para pesquisadores compartilharem o progresso em suas previsões em relação a dados experimentais reais.
O CASP organiza um desafio bienal para grupos de pesquisa testarem a precisão de suas previsões em relação a dados experimentais reais.
As equipes recebem uma seleção de sequências de aminoácidos para proteínas que tiveram sua forma exata mapeada em 3D – mas ainda não foram lançadas em domínio público. As equipes devem enviar suas melhores previsões para ver o quão próximas estão das estruturas reveladas posteriormente.
No CASP13 (em 2018), AlphaFold ficou em primeiro lugar. No CASP 14 (em 2020), apresentamos nossa versão mais recente do AlphaFold – que apresentou um nível de precisão tão alto que a comunidade considerou o problema do enovelamento de proteínas resolvido.
Desde então, o artigo sobre métodos AlphaFold recebeu mais de 10.000 citações. Isso o coloca entre os 100 artigos mais citados da última década e entre os 900 artigos mais citados de todos os tempos.
Gratuito para todos
Disponibilizamos gratuitamente as previsões do AlphaFold para qualquer pessoa da comunidade científica.
Fizemos isso através do banco de dados de estruturas de proteínas AlphaFold, em parceria com o Instituto Europeu de Bioinformática do EMBL – o principal laboratório de ciências da vida na Europa. A base de dados baseia-se em décadas de trabalho meticuloso realizado por cientistas, utilizando métodos tradicionais para determinar a estrutura das proteínas.
Nosso primeiro lançamento – em 22 de julho de 2021 – cobriu mais de 350.000 estruturas, incluindo o proteoma humano. Isso representa todas as cerca de 20 mil proteínas conhecidas expressas no corpo humano, juntamente com os proteomas de 20 organismos adicionais importantes para a pesquisa biológica, incluindo a levedura, a mosca da fruta e o camundongo.
Estes organismos são fundamentais para a investigação biológica moderna, incluindo descobertas vencedoras do Prémio Nobel, como a descoberta da insulina e o desenvolvimento de medicamentos que salvam vidas.
Este lançamento expandiu dramaticamente nosso conhecimento sobre estruturas proteicas. Mais do que dobrou o número de estruturas de proteínas humanas de alta precisão disponíveis para os cientistas.
Em 28 de julho de 2022, expandimos esta base de dados de quase um milhão de estruturas para mais de 200 milhões de estruturas – incluindo quase todas as proteínas catalogadas conhecidas pela ciência.
Já foi acessado por mais de um milhão de usuários em mais de 190 países.
“Este será um dos conjuntos de dados mais importantes desde o mapeamento do Genoma Humano”
Acelerando a descoberta científica
Nossos parceiros já estão usando o AlphaFold e o banco de dados de estrutura de proteínas AlphaFold para acelerar o progresso em problemas importantes do mundo real, incluindo a decomposição de plásticos descartáveis , a resolução de quebra-cabeças biológicos e a descoberta de novos medicamentos para tratar o câncer de fígado . Ao reduzir a necessidade de experiências lentas e dispendiosas, a AlphaFold poupou potencialmente ao mundo da investigação até mil milhões de anos de progresso – e biliões de dólares.
Um quarto das pesquisas que utilizam o AlphaFold está relacionada à compreensão e ao combate a doenças que causam milhões de mortes em todo o mundo.
A iniciativa Medicamentos para Doenças Negligenciadas (DNDi) está avançando na descoberta de medicamentos para doenças negligenciadas, como a doença de Chagas e a leishmaniose. Estas doenças afectam milhões de pessoas em comunidades pobres e vulneráveis.
Uma equipa da Universidade de Cambridge está a utilizar o AlphaFold para procurar uma vacina mais eficaz contra a malária , enquanto na Universidade do Colorado, em Boulder, outra equipa está a estudar a resistência aos antibióticos – um problema que causa 2,8 milhões de infecções só nos EUA todos os anos.