Aller au contenu

AlphaFold

Un article de Wikipédia, l'encyclopédie libre.

AlphaFold est un logiciel d'intelligence artificielle développé par Google DeepMind qui fournit une prédiction de la structure des protéines à partir de leur séquence en acides aminés. En 2018, sa première version se classe en tête du concours Critical Assessment of Protein Structure Prediction (CASP (en)). En 2020, sa seconde version remporte à nouveau le concours avec un niveau de précision salué par le monde scientifique, étant parfois même qualifié de révolutionnaire. Des centaines de milliers de prédiction de structures ainsi que la version AlphaFold 2 du logiciel sont mis en accès libre à partir de 2021. Cette avancée vaut aux développeurs de DeepMind Demis Hassabis et John Jumper de partager avec David Baker le prix Nobel de chimie en 2024[1].

Description

[modifier | modifier le code]

AlphaFold est un logiciel d'intelligence artificielle (IA) qui fait appel à l'apprentissage profond[2].

En 2020, selon John Jumper (chef du développement d'AlphaFold chez DeepMind), interviewé dans la revue Science, AlphaFold associe l'apprentissage profond à un « algorithme d'attention » qui en quelque sorte copie la manière dont un humain assemble les pièces d'un puzzle quand il connecte entre eux de petits amas de pièces préalablement réalisés (un amas représentant ici un petit assemblage d'acides aminés[3]).

AlphaFold utilise 128 processeurs d'apprentissage automatique qui ont entraîné cet algorithme sur environ 170 000 structures protéiques déjà connues [3].

L'IA peut ensuite modéliser des protéines constituées de dizaines à centaines d'acides aminés en tenant compte de ce qu'elle a appris sur la manière dont l'ordre de ces acides aminés dicte la façon très complexe dont « la myriade de poussées et de tractions entre eux donne naissance aux formes 3D complexes des protéines, qui, à leur tour, déterminent leur fonctionnement. La connaissance de ces formes aide les chercheurs à concevoir des médicaments qui peuvent se loger dans les poches et les crevasses des protéines. Il devient alors possible de synthétiser des protéines avec la structure souhaitée, ce qui pourrait ainsi accélérer le développement d'enzymes fabricant des biocarburants ou dégradant les déchets plastiques »[3].

Base de données

[modifier | modifier le code]

En 2021, DeepMind a ouvert une base de données publique de modèles de structure prédits par AlphaFold, pour plus de 365 000 protéines humaines, et de 20 organismes modèles; prévoyant d'y ajouter plus de 100 millions de protéines issues de diverses espèces. En 2024, cette base contient « des prédictions de structure pour presque toutes les protéines connues ». Elle pourrait révolutionner la chimie et la biochimie computationnelles[4].

Limites d'AlphaFold

[modifier | modifier le code]

Bien que les prédictions d'AlphaFold aient révolutionné la biologie structurale, elles ne sont pas exemptes d'erreurs. Une étude publiée en 2021 dans Nature Methods[5] compare les structures protéiques déterminées expérimentalement via des techniques comme la cristallographie aux rayons X avec les prédictions générées par AlphaFold. Les résultats montrent que, bien que globalement très précises, les prédictions de l'IA présentent de légères déviations par rapport aux structures obtenues expérimentalement.

Martin Weigt, professeur en biologie computationnelle à Sorbonne Université, explique que les prédictions d'AlphaFold sont « systématiquement un peu plus éloignées des structures expérimentales, même si ces écarts restent minimes »[6]. Ces petites différences soulignent que la détermination expérimentale des structures reste importante, notamment pour valider ou affiner les prédictions générées par AlphaFold.

AlphaFold 1

[modifier | modifier le code]

Fin 2018, la première version du logiciel AlphaFold permet à une équipe de chercheurs de se classer première lors du 13e concours Critical Assessment of Protein Structure Prediction (CASP (en)). Cette version utilise un réseau neuronal profond pour estimer une carte de distance entre les résidus et un potentiel statistique pour optimiser la structure. Elle a particulièrement bien réussi à prédire la structure la plus précise de cibles classées parmi les plus difficiles par les organisateurs du concours, et pour lesquelles aucune structure modèle existante n'était disponible[réf. souhaitée].

AlphaFold 2

[modifier | modifier le code]

En novembre 2020, avec AlphaFold 2, l'équipe gagne une seconde fois le concours du CASP[7],[8], atteignant un niveau de précision inégalé pour la prédiction de structures protéiques[9],[10],[Note 1]. Ces résultats sont décrits comme révolutionnaires[11],[12],[13],[14],[15],[16], et pouvant faire gagner des décennies aux laboratoires de recherche[3]. Cette version du logiciel utilise alors un système de sous-réseaux couplés basés sur des transformeurs, lui permettant d'affiner progressivement les informations sur les relations entre les résidus et les séquences, pour prédire la structure finale[9]. Ces résultats sont qualifiés de « stupéfiants » et « transformationnels » et cette IA est saluée comme une avancée majeure pour la biologie et l'accélération de la recherche en santé, chimie et pharmacochimie[17]. Selon Science, cette IA « a résolu l'un des grands défis de la biologie : prédire comment les protéines s'enroulent à partir d'une chaîne linéaire d'acides aminés en formes 3D qui leur permettent d'effectuer les tâches de la vie », et semble déjà assez précise pour prédire les effets d'une unique mutation[3].

La précision reste cependant insuffisante pour un tiers des prédictions de l'IA, et le calcul ne révèle pas le mécanisme ou les règles du repliement des protéines, faisant que ce problème ne peut être considéré comme complètement résolu[18],[19]. Elle ne prend pas non plus en compte les interactions entre les protéines et d'autres molécules, ni les modifications post-traductionnelles qui peuvent affecter la structure et la fonction des protéines[3]. Les méthodes traditionnelles expérimentales (cristallographie aux rayons X, cryo-microscopie électronique (cryo-EM) ne donnent pas toujours de bons résultats non plus[3].

En juillet 2021, AlphaFold 2 est décrit dans un article publié dans Nature[20]. Le logiciel est libre, de même qu'une base de données regroupant les structures de la plupart des protéines de plusieurs espèces, dont 20 000 protéines humaines[21],[22]. La même année, un groupe de recherche d'Harvard met en ligne un outil « notebook » permettant de tester AlphaFold 2 sans avoir à l'installer sur son ordinateur[10],[23],[24].

En septembre 2022, grâce aux résultats d'AlphaFold, il est annoncé que Demis Hassabis, directeur général de DeepMind, et John Jumper (en) reçoivent le prix des avancées capitales dans les sciences de la vie « pour avoir développé une méthode d'apprentissage (pour intelligence artificielle) en profondeur qui prédit rapidement et avec précision la structure tridimensionnelle des protéines à partir de leur séquence d'acides aminés »[25].

AlphaFold 3

[modifier | modifier le code]

Annoncé le 8 mai 2024, AlphaFold 3 est co-développé par Google DeepMind et Isomorphic Labs, deux filiales d'Alphabet. AlphaFold 3 ne se limite pas aux protéines, il peut également prédire la structure et les interactions avec l'ADN, l'ARN et certains ligands ou ions[26].

AlphaFold 3 introduit l'architecture "Pairformer", une nouvelle variante de l'architecture transformeur, similaire mais plus simple que l'architecture Evoformer introduite avec AlphaFold 2. Les prédictions du module Pairformer sont transmises à un modèle de diffusion (en), qui commence avec un nuage d'atomes et utilise ces prédictions pour progresser itérativement vers une représentation en 3D de la structure moléculaire[27].

Le serveur AlphaFold est créé pour fournir un accès gratuit à AlphaFold 3 pour la recherche non commerciale. La capacité de prédire comment les protéines interagissent avec les molécules généralement trouvées dans les médicaments (telles que les ligands ou les anticorps) devrait significativement accélérer la découverte de nouveaux médicaments. L'entreprise Isomorphic Labs a d'ailleurs déclaré en mai 2024 qu'elle utilisait déjà AlphaFold 3 avec d'autres modèles d'IA pour automatiser le processus de découverte de médicaments[27].

Liens externes

[modifier | modifier le code]

Notes et références

[modifier | modifier le code]
  1. Le test compare la prédiction à un travail similaire qui serait fait en laboratoire. AlphaFold a atteint ou dépassé la note de 90/100 dans deux tiers des cas.

Références

[modifier | modifier le code]
  1. (en) Ewen Callaway, « Chemistry Nobel goes to developers of AlphaFold AI that predicts protein structures », Nature,‎ (DOI 10.1038/d41586-024-03214-7, lire en ligne, consulté le )
  2. « Comment fonctionne AlphaFold, le programme d'intelligence artificielle qui dessine les protéines ? », Le Monde.fr,‎ (lire en ligne, consulté le ).
  3. a b c d e f et g (en) Robert Service, « ‘The game has changed.' AI triumphs at solving protein structures », Science,‎ (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.abf9367, lire en ligne, consulté le ).
  4. (en) Ewen Callaway, « AlphaFold found thousands of possible psychedelics. Will its predictions help drug discovery? », Nature,‎ (DOI 10.1038/d41586-024-00130-8, lire en ligne, consulté le ).
  5. (en) John Jumper, Richard Evans, Alexander Pritzel et Tim Green, « Highly accurate protein structure prediction with AlphaFold », Nature, vol. 596, no 7873,‎ , p. 583–589 (ISSN 1476-4687, DOI 10.1038/s41586-021-03819-2, lire en ligne, consulté le )
  6. « IA : AlphaFold ne permettra pas de se passer d'expérimentation humaine », sur France Culture, (consulté le )
  7. (en) « DeepMind's AI makes gigantic leap in solving protein structures », sur Nature, (consulté le ).
  8. (en) Sam Shead, « DeepMind solves 50-year-old ‘grand challenge' with protein folding A.I. », sur CNBC, (consulté le )
  9. a et b (en) « DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology », sur MIT Technology Review (consulté le )
  10. a et b « L'intelligence artificielle, génie de la biologie moléculaire », Le Monde.fr,‎ (lire en ligne, consulté le )
  11. Maurice Mashaal, « Repliement des protéines : la percée de l'IA », sur Pourlascience.fr, (consulté le )
  12. « AlphaFold, l'intelligence artificielle en protéomique », sur Sciences et Avenir (consulté le )
  13. Science-et-vie.com, « Intelligence artificielle : la biologie moléculaire entre... - Science & Vie », sur www.science-et-vie.com, (consulté le )
  14. (en) Ewen Callaway, « ‘It will change everything': DeepMind's AI makes gigantic leap in solving protein structures », Nature, vol. 588, no 7837,‎ , p. 203–204 (DOI 10.1038/d41586-020-03348-4, lire en ligne, consulté le )
  15. (en) « ‘The game has changed.' AI triumphs at solving protein structures », sur www.science.org (consulté le )
  16. (en) « DeepMind AI cracks 50-year-old problem of protein folding », sur the Guardian, (consulté le )
  17. (en) Sam Shead, « DeepMind solves 50-year-old ‘grand challenge' with protein folding A.I. », sur CNBC, (consulté le ).
  18. (en) Philip Ball, « Behind the screens of AlphaFold », sur Chemistry World, (consulté le )
  19. (en-US) Stephen, « No, DeepMind has not solved protein folding », sur Reciprocal Space (consulté le )
  20. (en) Ewen Callaway, « DeepMind's AI predicts structures for a vast trove of proteins », Nature, vol. 595, no 7869,‎ , p. 635–635 (DOI 10.1038/d41586-021-02025-4, lire en ligne, consulté le )
  21. (en) « AI firm DeepMind puts database of the building blocks of life online », sur the Guardian, (consulté le )
  22. (en-GB) « AI breakthrough could spark medical revolution », BBC News,‎ (lire en ligne, consulté le )
  23. (en) Michael Eisenstein, « Artificial intelligence powers protein-folding predictions », Nature, vol. 599, no 7886,‎ , p. 706–708 (DOI 10.1038/d41586-021-03499-y, lire en ligne, consulté le )
  24. (en) Milot Mirdita, Sergey Ovchinnikov et Martin Steinegger, « ColabFold - Making protein folding accessible to all », bioRxiv,‎ , p. 2021.08.15.456425 (DOI 10.1101/2021.08.15.456425, lire en ligne, consulté le )
  25. « For developing a deep learning AI method that rapidly and accurately predicts the three-dimensional structure of proteins from their amino acid sequence. » sur (en) Winners Of The 2023 Breakthrough Prizes In Life Sciences, Mathematics And Fundamental Physics Announced.
  26. « Intelligence artificielle : la promesse folle de la modélisation du vivant », sur Le Point, (consulté le )
  27. a et b (en) James Thomason, « Google’s AlphaFold 3 AI predicts the very building blocks of life », sur VentureBeat, (consulté le )