Le programme a trouvé les 200 millions de protéines connues de la science : comment est-ce possible ?

Les chercheurs ont compilé une base de données de 200 millions de structures protéiques, et ils y sont parvenus avec l’aide du programme AlphaFold.

que DeepMind a développé en 2018 et sorti en  juillet 2021 . la structure tridimensionnelle d’une protéine basée sur la séquence de ses acides aminés, les éléments constitutifs qui composent leLa structure d’une protéine dicte sa fonction, de sorte que la base de données identifiée par AlphaFold aideraIdentifier de nouvelles fonctions protéiques que les humains peuvent utiliser.

Protéines paradoxales

Les protéines sont les éléments constitutifs de la vie. Elles sont produites par une variété d’organismes, des bactéries aux plantes et aux animaux, et  lorsqu’elles se forment, elles s’additionnent en quelques millisecondes.  Formés de chaînes d’acides aminés pliés en formes complexes, leur structure tridimensionnelle détermine en grande partieUne fois que vous avez découvert comment une protéine est repliée, vous pouvez comprendre comment elle fonctionne. et changer son comportement. 

Bien que l'ADN fournisse des instructions pour créerchaînes d’acides aminés, il a été très difficile de prédire comment ils interagissent pour former une forme tridimensionnelle. Jusqu’à récemment, les scientifiques n’avaient déchiffré qu’une fraction des 200 millions de protéines connues de la science. Le problème est que leur structure est si complexe qu’il est presque impossible de deviner quelle forme ils prendront.

AlphaFold de DeepMind a créé des images 3D de structures protéiques. Image reproduite avec l'aimable autorisation de DeepMind

Cyrus Levinthal, chercheur moléculaire américainbiologiste, a écrit dans un article de 1969 sur le paradoxe : malgré le nombre énorme de configurations possibles, les protéines se replient rapidement et avec précision. De plus, chaque protéine peut prendre 10 à 300 formes finales possibles.

Ainsi, écrit Levinthal, si l’on essayait de trouver la forme correcte d’une protéine en essayant chaque configuration l’une après l’autre, cela prendrait plus de temps que l’existence de l’univers.

Tentatives de scientifiques

Les scientifiques disposent de moyens de visualiser les protéineset analyser leur structure, mais c'est un travail trop lent et difficile. Selon la revue Nature, la cristallographie aux rayons X est le plus souvent utilisée pour imager les protéines. Dans cette méthode, les rayons X visent des cristaux de protéines solides et mesurent leur réfraction. Le but est de déterminer comment la protéine est structurée. Selon DeepMind, ces travaux expérimentaux ont permis de déterminer la forme d'environ 190 000 protéines.

Nouvelle méthode

En novembre 2020, le groupe DeepMind s'est engagé dansintelligence artificielle, a annoncé le développement d'un programme appelé AlphaFold qui peut prédire rapidement ces informations à l'aide d'un algorithme. Depuis, il étudie les codes génétiques de chaque organisme dont le génome a été séquencé et prédit les structures des centaines de millions de protéines qu’ils contiennent ensemble.

AlphaFold fonctionne en accumulant des connaissancessur les séquences et les interactions des acides aminés, en essayant d'interpréter les structures des protéines. En conséquence, l’algorithme a appris à prédire la forme des protéines en quelques minutes avec une précision allant jusqu’au niveau atomique.

L'année dernière, DeepMind a été publiéLa base de données ouverte sur la structure des protéines contient 20 espèces, dont presque toutes les 20 000 protéines exprimées par les humains. Il a maintenant terminé le travail et publié les structures prédites pour plus de 200 millions de protéines.

Comment la technologie est-elle appliquée ?

Les chercheurs exploitent déjà le fruit de leur travailAlphaFold. Selon The Guardian, le programme a permis aux scientifiques de caractériser définitivement une protéine clé du parasite du paludisme qui ne se prêtait pas à la cristallographie aux rayons X. Cela permettra à terme d’améliorer le vaccin contre la maladie.

Image 3D de la protéine du paludisme. Image reproduite avec l'aimable autorisation de Deepmind

Wilde Leipart, chercheur sur les abeillesde l'Université norvégienne des sciences de la vie a utilisé AlphaFold pour révéler la structure de la vitellogénine. Il s’agit d’une protéine reproductive et immunitaire produite par tous les animaux pondeurs. Cette découverte permettra de développer de nouvelles façons de protéger, par exemple, les abeilles mellifères et les poissons contre les maladies. C’est important, car ces animaux sont importants pour nourrir l’humanité.

Le programme informe également sur la recherche de nouveauxproduits pharmaceutiques, a déclaré Rosana Kapeller, PDG de ROME Therapeutics, dans un communiqué de DeepMind. « La vitesse et la précision d'AlphaFold accélèrent le processus de développement de médicaments. Nous commençons tout juste à comprendre son impact sur le développement des produits pharmaceutiques », a-t-elle conclu.

Les modèles AlphaFold sont également utilisés par les scientifiquesdu Centre pour l'innovation enzymatique de l'Université de Portsmouth pour identifier les enzymes du monde naturel qui peuvent être adaptées au traitement des plastiques.

Lire la suite:

Bientôt une tempête solaire frappera la Terre : la matière vole à une vitesse de 800 km/s

Les scientifiques ont filmé une créature étrange avec des tentacules, qu'ils ont confondue avec une fleur

La Russie quitte l'ISS: que va-t-il se passer maintenant et pourquoi le maintien de la station est menacé