Que pourrait signifier la « résolution » de DeepMind du problème de repliement des protéines pour la recherche sur le cancer ?

Cancer Research UK Homepage

La société d’intelligence artificielle DeepMind a-t-elle vraiment « résolu » le problème séculaire du repliement des protéines ? Et qu’est-ce que cela pourrait signifier pour notre recherche? Nous avons demandé à deux de nos experts en protéines.

Modèle 3D de la structure cristalline de la protéine marqueur tumoral. Crédit : Sergent.

Plus tôt ce mois-ci, le biologiste Mohammed AlQuraishi a été poussé à s’exclamer avec enthousiasme qu’un nouvel ensemble de découvertes constituaient « un changement sismique et sans précédent si profond qu’il a littéralement bouleversé un champ du jour au lendemain ». Vous ne lisez pas ça tous les jours.

Qu’est-ce qui l’avait poussé à faire une déclaration aussi audacieuse ? C’était la nouvelle que la société britannique d’intelligence artificielle appartenant à Google, DeepMind, avait «résolu» l’énigme vieille de plusieurs décennies sur la façon dont les protéines se replient avec une nouvelle version de leur système d’apprentissage en profondeur, AlphaFold.

Les protéines sont fondamentales pour toute vie et la façon mystérieuse dont elles se plient en des formes 3D élaborées a des implications dramatiques sur le fonctionnement de nos cellules et de nos tissus. C’était donc certainement une grande nouvelle et les gros titres en faisaient autant écho. Mais que nous ont dit les résultats, que pouvaient-ils signifier pour la recherche sur le cancer et l’hyperbole était-elle justifiée ? Nous avons demandé à deux de nos experts spécialistes des protéines, qui essaient de mieux comprendre comment le repliement des protéines affecte les résultats du cancer, de donner leur avis sur l’actualité.

Mais d’abord…

Quel problème DeepMind a-t-il résolu ?

Le «problème de repliement des protéines» est resté un problème depuis qu’il a été posé pour la première fois il y a environ 50 ans. En un mot, être capable de prédire comment une protéine se replie est essentiel pour comprendre comment elle fonctionnera, ce qui pourrait à son tour apporter des réponses à de grandes questions, notamment comment traiter des maladies comme le cancer.

Les chercheurs ont consacré beaucoup de temps, d’efforts et de ressources à essayer d’examiner la façon dont les protéines se replient, ce qui a conduit à l’émergence de techniques expérimentales innovantes mais coûteuses pour étudier les structures des protéines telles que la cristallographie aux rayons X, qui crée une structure 3D une protéine utilisant, vous l’aurez deviné, des rayons X. Il existe également d’autres techniques, telles que l’utilisation d’un microscope électronique pour envoyer des électrons sur une protéine afin d’agrandir son image.

Mais bien que ces techniques soient considérées comme optimales, elles ont chacune leurs limites. La cristallographie aux rayons X ne fonctionne vraiment que lors de l’étude de protéines stables pouvant former les cristaux nets nécessaires au processus. Et même alors, c’est une tâche laborieuse et coûteuse. Avec des protéines flexibles ou « instables », qui ont moins de structure et de rigidité, c’est un tout autre jeu de balle.

Mais heureusement, en 1963, le biochimiste américain Christian Anfinsen a proposé que la séquence unidimensionnelle d’acides aminés d’une protéine – quelque chose de beaucoup plus facile à obtenir – devrait révéler sa structure 3D complète. Ce travail lui a valu un prix Nobel en 1972. Et depuis ce temps, les scientifiques explorent cette voie en utilisant des méthodes de calcul moins coûteuses et plus accessibles. Mais là réside un autre problème. Il existe un nombre presque infini de façons dont une protéine peut se replier et toutes les identifier peut prendre toute une vie. Pas si bon pour relever des défis importants comme le cancer.

C’est là qu’intervient DeepMind. Leur technologie AlphaFold utilise l’apprentissage en profondeur pour prendre ce que nous savons déjà sur les structures de protéines connues conservées dans une base de données mondiale et « apprendre » et donc prédire les structures d’autres protéines. L’équipe a testé les prédictions faites par AlphaFold contre des structures qui avaient été déterminées expérimentalement, en utilisant des méthodes telles que la cristallographie aux rayons X. Et les résultats semblaient extrêmement prometteurs. AlphaFold a réussi à prédire les structures des protéines avec un niveau de précision jamais vu auparavant à faible coût et en quelques jours, pas des années ou des décennies. Et c’est ce qui a un tout petit peu excité la communauté scientifique.

Alors, qu’en pensent nos experts en protéines ?

Le professeur Richard Bayliss de l’Université de Leeds utilise la cristallographie pour déterminer la forme des protéines et comment elles se replient. Cette connaissance est vitale pour découvrir leur fonction dans les cellules cancéreuses et, surtout, comment elles peuvent être ciblées et traitées. Il se concentre particulièrement sur la protéine Myc, qui est associée à de nombreux cancers différents, y compris les formes agressives de cancer de la prostate et du sein.

Le Dr Patricia Muller de notre Cancer Research UK Manchester Institute étudie une protéine qui joue un rôle important dans l’arrêt du développement du cancer, la protéine p53. Elle s’intéresse particulièrement au fonctionnement de p53 dans ses états déplié et replié et pense que ce dernier a un impact sur son fonctionnement dans les cancers.

Qu’avez-vous pensé de la nouvelle ? Est-ce aussi monumental que les gros titres voudraient nous le faire croire ?

Richard: C’est certainement une avancée impressionnante et passionnante, mais dans un sens plus limité et plus spécifique que certains des titres ne le laissent croire. Être capable de prédire avec précision la structure d’une protéine à partir de sa séquence d’acides aminés a été une sorte de Saint Graal pour les biologistes structurels. Le travail de DeepMind est la première fois que cela a été réalisé avec un niveau de fiabilité qui peut rivaliser avec les méthodes expérimentales. C’est suffisant pour vous donner la confiance nécessaire pour faire des investissements substantiels dans les prédictions qui découlent de la structure.

Il est limité à plusieurs égards, mais le plus important est peut-être qu’il ne peut pas prédire avec précision la structure des protéines qui travaillent intimement avec d’autres protéines, et dont la structure dépend donc de la présence de ces autres protéines. Ce type de problème est un objectif majeur des biologistes structurels, et les structures prédites par DeepMind seront utiles pour nous aider à interpréter et à utiliser les données expérimentales.

Patricia : Notre compréhension du repliement des protéines provient principalement d’études utilisant des techniques qui demandent beaucoup de temps et beaucoup de patience. Si AlphaFold est aussi précis que les articles le suggèrent, cela ferait vraiment une grande différence et accélérerait de nombreuses lignes de recherche différentes.

Qu’est-ce que cela pourrait signifier pour la recherche sur le cancer?

Richard: Malgré les récentes avancées technologiques dans les techniques expérimentales, telles que la microscopie électronique cryogénique et la cristallographie à haut débit, la détermination d’une structure de protéine est un défi qui peut prendre de nombreuses années à résoudre. Certains projets sont retardés dès la première étape car la protéine d’intérêt ne peut pas être fabriquée en quantité ou en pureté suffisante pour que les méthodes fonctionnent, ou s’avèrent être des protéines instables. C’est là que le fait d’avoir une méthode de calcul fiable pourrait fournir suffisamment d’informations pour faire avancer un projet. Par exemple, si nous voulons cartographier l’emplacement des mutations cancéreuses sur la structure de la protéine pour prédire comment elles pourraient affecter sa fonction, nous pourrions le faire beaucoup plus rapidement avec la méthode de calcul DeepMind qu’avec les méthodes expérimentales.

Il est difficile de dire à quel point il sera utile pour la découverte de médicaments, qui est une application importante de la biologie structurelle dans la recherche sur le cancer, car nous dépendons de modèles précis générés par cristallographie aux rayons X. Mais parfois, nous devons utiliser des modèles informatiques pour des protéines avec des structures inconnues et avoir des modèles plus fiables nous aidera à développer des médicaments plus efficacement.

Patricia : Cela pourrait aider à bien des égards, comme le développement de médicaments ou simplement pour mieux comprendre le fonctionnement des protéines. Par exemple, certains médicaments agissent en empêchant les protéines de se lier à d’autres protéines. Si nous connaissons leur structure, nous pouvons prédire comment ils se lieront les uns aux autres et nous pourrons alors concevoir des médicaments qui empêcheraient la liaison entre ces protéines. Pour les protéines dont nous connaissons la structure, cela s’est avéré être une stratégie efficace. Cependant, les techniques dont nous disposons pour élucider la structure des protéines ne fonctionnent pas pour toutes les protéines. Les prédictions d’AlphaFold pourraient être très utiles pour déterminer les structures de protéines pour lesquelles d’autres techniques n’ont pas encore fonctionné.

Comment utiliserez-vous ces nouvelles informations pour faire avancer votre travail ?

Richard: J’étudie la protéine Myc, qui est associée à de nombreux cancers humains mais qui est considérée comme « non médicamenteuse » par la plupart des chercheurs car elle n’a pas de structure fixe. L’approche DeepMind ne sera pas d’une grande aide pour Myc lui-même car il n’adopte une structure que lorsqu’il se lie à d’autres protéines.

Mais il pourrait être très utile d’étudier les protéines de liaison qui s’associent à Myc, dont certaines sont des protéines très difficiles à utiliser. Nous ne nous attendons pas à ce que Myc affecte les structures de ses partenaires de liaison, et donc les prédictions faites par AlphaFold sur ces autres protéines sont susceptibles d’être précises et utiles.

Ces structures, ainsi que nos données expérimentales, nous permettraient de générer des modèles d’interactions entre Myc et ces protéines partenaires. Et ces informations pourraient être utilisées pour développer des molécules qui bloquent les interactions, que nous considérons comme une voie vers le développement de nouveaux traitements contre le cancer.

Patricia : Mon travail porte sur la protéine p53. Nous ne connaissons pas encore la structure complète de p53 et il est très difficile de déterminer sa forme avec les techniques conventionnelles. Actuellement, nous comptons sur des anticorps pour nous aider à détecter la structure, mais ils ne peuvent détecter que deux états : plié et déplié. Mais je crois qu’il y a plus que cela dans l’histoire et qu’il y a en fait plusieurs états différents de p53 plié. J’aimerais voir si AlphaFold pourrait m’aider à découvrir ces états car dans le cancer, il existe des centaines de façons différentes de muter p53. Je pense que la technologie pourrait m’aider à révéler pourquoi c’est le cas et à faire la lumière sur la façon dont ces mutants sont différents les uns des autres.

Alors, qu’avons-nous appris ?

Il semble que même si la percée d’AlphaFold peut prendre un certain temps pour profiter directement à nos chercheurs dans leur travail de lutte contre le cancer, cette nouvelle présente des avantages évidents. DeepMind a-t-il entièrement « résolu » le problème de repliement des protéines ? Le jury est encore ouvert selon nos experts, mais nous sommes certainement encouragés par son potentiel à déterminer plus rapidement, plus précisément et à moindre coût la structure des protéines afin de mieux comprendre comment elles fonctionnent et peuvent être ciblées dans les cancers humains.

Joanna Lewin est responsable des communications philanthropiques chez Cancer Research UK