Joindre les points : comment notre nouvelle stratégie de données de recherche débloquera la puissance des mégadonnées

Cancer Research UK Homepage

Les innombrables données produites par la recherche moderne recèlent un potentiel incroyable pour faire progresser notre compréhension du cancer et la façon dont nous détectons et traitons la maladie. Mais pour tirer parti de cela, il faut une approche conjointe – ici, le Dr Melissa Lewis-Brown nous explique pourquoi la nouvelle stratégie de données de recherche de Cancer Research UK a un rôle important à jouer…

Les mégadonnées deviennent un outil essentiel pour vaincre le cancer. Cependant, notre capacité à générer des données pertinentes sur le cancer de divers types a dépassé notre capacité à les utiliser au maximum. Pour tirer pleinement parti de la valeur des données, il faudra les intégrer et les analyser. Heureusement, la science des données innovante offre désormais cette opportunité.

Parallèlement aux données générées par la recherche, telles que les données omiques et les données cliniques, les chercheurs sur le cancer utilisent de plus en plus une grande variété d’autres types de données. Les données de santé conservées dans les dossiers de santé électroniques, l’explosion des données acquises par le biais de capteurs ou d’applications portables, ainsi que d’autres modes de données, comme l’environnement, peuvent tous désormais jouer un rôle important dans la recherche sur le cancer. Et c’est pour n’en citer que quelques-uns. Surmonter les nombreux défis liés à l’utilisation de ces données est le seul moyen de libérer leur potentiel pour débloquer de nouvelles découvertes sur le cancer vers une meilleure prévention, une détection plus précoce et des traitements plus efficaces.

Cancer Research UK a traditionnellement soutenu des scientifiques de laboratoire et cliniques. Mais les scientifiques des données et autres experts en données travaillent de plus en plus avec d’autres chercheurs pour adopter une approche axée sur les données dans le domaine de la découverte et de la science translationnelle du cancer, désormais incroyablement riche en données. L’approche de la recherche sur le cancer est devenue multidisciplinaire au fil des ans et elle englobe désormais la science des données et d’autres experts en données, qui ont les compétences nécessaires pour appliquer ces approches pour faire des découvertes dans le domaine de la science du cancer.

Imagerie, stratification des patients et science de la découverte… la science des données est partout

Jusqu’à présent, certains des meilleurs exemples de science des données efficace ont utilisé l’intelligence artificielle pour glaner plus d’informations à partir d’images que l’œil humain ne peut en gérer. Traditionnellement, par exemple, les radiologues ont des images du globe oculaire à la recherche de signes de cancer. De plus en plus, l’apprentissage automatique et la vision par ordinateur sont utilisés non seulement pour automatiser ce processus, mais aussi pour détecter le cancer plus tôt. Ces techniques peuvent « voir » des choses que l’œil humain ne peut pas – qui plus est, elles peuvent souvent le faire beaucoup plus rapidement.

Et nous avons vu une approche centrée sur les données utilisée pour les traitements ainsi que pour la détection. En ce qui concerne la radiothérapie, par exemple, les cliniciens doivent d’abord déterminer où appliquer la radiothérapie – un processus qui peut prendre du temps lorsqu’il est effectué manuellement. Encore une fois, l’apprentissage automatique et la vision par ordinateur peuvent extraire des données de milliers ou de millions de parcours de patients antérieurs pour prédire quelle segmentation et quel traitement sont les plus susceptibles de conduire aux meilleurs résultats de santé.

« De plus en plus de chercheurs intègrent la science des données pour relever des défis spécifiques dans leur propre domaine »

Les travaux du professeur Raj Jena en sont un exemple. Raj applique des techniques d’imagerie avancées et des modalités de traitement par radiothérapie pour améliorer les résultats des patients atteints de tumeurs solides du système nerveux central. Il s’intéresse particulièrement à l’imagerie par résonance magnétique de ces tumeurs et à la radiothérapie avec modulation d’intensité.

Un autre exemple peut être trouvé dans le domaine du cancer du sein. CRUK a financé la génération de la base de données d’images de mammographie OPTIMAM – une ressource partageable avec des images de mammographie traitées et non traitées provenant de centres de dépistage du sein au Royaume-Uni, avec des cancers annotés et des détails cliniques. La base de données comprend des mammographies de dépistage en série qui ont été recueillies sur une période de 10 ans avec des données provenant de près de 173 000 femmes. La base de données est constituée de données sur tous les cancers du sein dans une population dépistée, y compris les cancers d’intervalle. Cette ressource a été largement réutilisée pour développer et évaluer des algorithmes d’intelligence artificielle pour la détection du cancer du sein.

Cependant, la science des données ne se limite pas aux équipes de science des données pures. De plus en plus de chercheurs intègrent la science des données pour relever des défis spécifiques dans leur propre domaine. De nombreux chefs de groupe de recherche, qui ne s’identifient peut-être pas eux-mêmes comme des scientifiques des données, apportent de plus en plus une expertise telle que l’apprentissage automatique à leurs équipes, là où ils ajoutent le plus de valeur à leur travail.

Prenez le travail du professeur Rebecca Fitzgerald dans le développement de la Cytosponge, par exemple. Le dispositif – une petite capsule attachée à une fine ficelle qui permet la collecte de cellules de l’œsophage – facilite la détection précoce de l’œsophage de Barrett et du cancer de l’œsophage. Rebecca et son équipe ont mené ce travail sur la stratégie de détection précoce du cancer de l’adénocarcinome de l’œsophage – largement reconnu comme un cancer dont les besoins ne sont pas satisfaits – de la découverte scientifique jusqu’à la mise en œuvre en clinique.

Le développement de la Cytosponge est devenu une histoire célèbre – avec Rebecca présentant le travail sous forme de conférence plénière lors de la récente conférence de l’American Association for Cancer Research. Cependant, moins connu est le rôle que la science des données et le big data multimodal ont joué dans le développement du dispositif. L’une des étapes essentielles du travail de Rebecca consistait à déterminer si la maladie de Barrett était une étape nécessaire dans le développement de ce type de cancer. Après que le séquençage de l’ARN unicellulaire ait découvert un certain nombre de candidats, une approche de modélisation informatique a été utilisée pour identifier le précurseur cellulaire obligatoire qui était toujours associé à l’œsophage de Barrett. De plus, ce résultat a ensuite été validé à l’aide d’un modèle informatique multi-échelle utilisant la santé au niveau de la population.

Cependant, ce cancer n’est pas suffisamment fréquent pour justifier le dépistage de populations entières de personnes, l’enjeu était d’identifier qui est le plus à risque de ce cancer à dépister à l’aide de la Cytosponge. L’équipe savait que ce cancer est plus répandu chez les hommes et dans certaines parties du monde, et associé à des symptômes tels que les brûlures d’estomac, ainsi qu’aux facteurs de risque de cancer les plus courants – l’âge, l’IMC et le statut tabagique.. Il s’agissait alors d’un problème parfaitement adapté à une solution impliquant l’intégration de différents modes de données. Un algorithme a été développé et utilisé pour faire exactement cela, permettant à l’équipe d’identifier les personnes les plus à risque afin qu’elles puissent cibler les efforts de dépistage.

Ensemble, le travail en laboratoire humide pour trouver un biomarqueur et la science des données impliquant des données multimodales ont conduit à l’utilisation de la Cytosponge pour identifier dix fois plus de cas d’œsophage de Barrett que l’approche de référence. Ce fut une formidable réussite et une grande partie des données utilisées, du moins dans les travaux précliniques, provenaient d’échantillons britanniques. Cela témoigne de ce qui peut être réalisé avec une collaboration autour d’une infrastructure adaptée à l’usage.

Le travail de Cytosponge n’est pas le seul exemple de la façon dont la science des données peut stratifier les patients pour améliorer les soins contre le cancer. Les techniques informatiques aident également à stratifier les patients subissant une immunothérapie et une radiothérapie. Environ 60% de toutes les personnes diagnostiquées avec un cancer subissent une radiothérapie à un moment donné, il est donc vital de pouvoir identifier les personnes les plus susceptibles de souffrir d’effets secondaires graves et d’utiliser l’IA pour améliorer l’application de la radiothérapie. Le biologiste informatique, le professeur Bissan Al-Lazikani, a utilisé les données sur les résultats, les mesures cliniques et les profils génétiques de près de 1 000 patients atteints d’un cancer de la prostate pour générer un modèle d’apprentissage automatique. Elle a trouvé de nombreux paramètres qui semblaient affecter la probabilité d’une toxicité grave chez un individu et a réussi à identifier ceux qui importaient le plus.

Et, bien sûr, la science des données peut également être extrêmement efficace dans la science de la découverte ainsi que dans le travail clinique. La professeure Serena Nik-Zainal et son équipe utilisent des méthodes informatiques pour décrire les cicatrices des dommages historiques à l’ADN et des processus de réparation qui se sont produits tout au long du développement d’une tumeur. Ces mutations passagères – bien qu’elles ne soient pas à l’origine du cancer – peuvent nous aider à comprendre les étiologies qui sous-tendent le cancer. Les connaissances que Serena et son équipe ont acquises grâce à la combinaison d’analyses informatiques et d’expériences dans des systèmes cellulaires ont conduit au développement d’outils algorithmiques cliniques – des outils qu’ils ont l’intention de traduire bientôt en utilité clinique.

Notre stratégie de données de recherche

Ce sont tous des exemples qui ont surmonté les nombreux obstacles auxquels la science des données est confrontée. Mais d’autres subsistent et nous empêchent d’utiliser pleinement la puissance de cette approche pour la recherche sur le cancer. Ce sont ces défis que notre stratégie de données de recherche récemment lancée vise à résoudre, et c’est ce pouvoir que nous voulons réaliser, au profit des patients atteints de cancer.

Dans la communauté du cancer, nous sommes au service des personnes touchées par le cancer. La confiance des patients fait partie intégrante de la recherche sur le cancer, en particulier dans la manière dont nous utilisons les données des patients pour la recherche. La confidentialité, la compréhension, la confiance et le soutien des patients sont tous des ingrédients essentiels de la science des données dans la recherche sur le cancer. Ainsi, la voix du patient sera au cœur de cette stratégie. Nous nous engageons à comprendre quelles sont les préoccupations des gens et ce que nous pouvons faire pour développer conjointement des activités visant à atténuer ces préoccupations. Et nous aiderons le public à voir comment les données des patients profitent aux personnes touchées par le cancer grâce à notre travail d’engagement et d’implication.

Malgré toutes les promesses de l’apprentissage automatique, de la vision par ordinateur, des statistiques avancées, etc., chacun repose sur l’accès en temps opportun à des données de haute qualité. Mais comprendre comment utiliser efficacement ces données et réaliser pleinement leur potentiel nécessite la mise en relation de différents types de données – et cela peut être un véritable défi.

Notre nouvelle stratégie de données de recherche vise à relever bon nombre de ces défis et à jeter les bases d’une communauté scientifique des données florissante avec le soutien, la confiance et la participation des patients et du public, et sans entrave par les problèmes d’accès aux données, de qualité, de liaison, etc. une ambition à long terme, mais nous mettons tout le poids de CRUK pour faire de cette vision une réalité au profit des personnes touchées par le cancer.

La recherche financée par le CRUK génère des quantités phénoménales de données de recherche. Nous encouragerons et faciliterons le partage de données de recherche de haute qualité pour d’autres recherches sur le cancer, car les données de recherche sont intellectuellement précieuses pour l’ensemble de la communauté de la recherche sur le cancer. Nous avons l’intention de travailler en partenariat avec d’autres pour résoudre les défis et réaliser les avantages pour les patients du partage sécurisé des données afin de faciliter la science des données innovante et de débloquer les informations du Big Data.

Les fondements de notre stratégie de données de recherche sont les suivants :

  1. Gagnez et maintenez la confiance, la confiance et le soutien du public et des patients, et amplifiez leur voix dans les discussions sur les données des patients.
  2. Rendre les données de recherche plus faciles à trouver, accessibles, interopérables et réutilisables, tout en préservant la sécurité et la confidentialité des données des patients.
  3. Renforcer l’environnement national de la science des données sur le cancer.
  4. Construire une communauté collaborative et solidaire de la science des données sur le cancer.
  5. Transformez les découvertes en avantages pour les patients grâce à un partenariat transparent et équitable avec les secteurs public, privé et caritatif, y compris les universités, le NHS et les entités commerciales.
  6. Attirez et fidélisez les talents data.
  7. Garantir l’égalité, la diversité et l’inclusion de ceux qui font de la science des données et des patients qui en bénéficient.
  8. Améliorer la durabilité environnementale et l’efficacité de la science des données.

Toute la force motrice de cette stratégie est d’améliorer les résultats pour les patients atteints de cancer. Maximiser la quantité de connaissances que la communauté de la recherche sur le cancer peut glaner à partir de toutes les données disponibles est la chose même qui nous permettra d’apprendre des patients qui ont souffert et ont été perdus à cause du cancer. La puissance de l’empreinte qu’ils ont laissée sous la forme de données de recherche et de santé recèle un potentiel incroyable. Et c’est un potentiel que nous travaillerons sans relâche pour atteindre, car cela contribuera non seulement à améliorer les résultats pour les patients aujourd’hui, mais aidera également à avancer le jour où tous les cancers seront guéris.

Nous avons besoin de toi…

Nous voulons connaître votre point de vue en tant que chercheur à ce sujet. Si vous souhaitez partager vos réflexions sur ce que nous faisons dans cet espace, veuillez me contacter et faites-le moi savoir à researchdata@cancer.org.uk

Auteur:
Le Dr Melissa Lewis-Brown est responsable de la stratégie des données de recherche chez Cancer Research UK