« Nous vivons une révolution numérique tirée non seulement par l’abondance de données, mais également par notre capacité à collecter, stocker et analyser les informations », déclare Xosé Fernández, Directeur des data à l’Institut Curie.
-
- Xosé Fernandez, Directeur des data à l’Institut Curie.
Avec l’avènement du numérique et les progrès informatiques, le monde de la santé est entré dans l’ère des big data. L’analyse de ces données par des programmes informatiques (ou algorithmes) associée à l’expertise des médecins est prometteuse, particulièrement dans la lutte contre le cancer, où les recherches sont nombreuses.
« Les capacités des ordinateurs sont quasi illimitées : ils peuvent analyser des milliards d’ informations, à une vitesse considérable et en comparant une multitude de paramètres, alors que le cerveau humain ne peut guère gérer plus de 5 ou 7 variables en même temps. » résume Irène Buvat, directrice d’une unité de recherche au Service hospitalier Frédéric Joliot (CEA, Orsay)
Publié par Émilie Gillet 14 mai 2019, sur https://curie.fr/
Les données , une source intarissable
-
- En France, les données de santé bénéficient d’un écosystème unique au monde.
En 2016, la loi de modernisation du système de santé a en effet créé le Système national des données de santé (SNDS). Il compile les données publiques (Assurance maladie, hôpitaux, causes médicales de décès et données relatives au handicap), couvrant ainsi plus de 90 % de la population française. Le SNDS permet notamment de retracer les parcours de soins des patients jusqu’à leur décès, de 2006 à aujourd’hui. L’objectif est de mettre à disposition ces données, sous le contrôle de la Commission nationale de l’informatique et des libertés (Cnil), afin de favoriser les études, recherches ou évaluations présentant un caractère d’intérêt public.
À ces vastes bases s’ajoutent depuis quelques années des données cliniques et biologiques très détaillées, issues des dossiers médicaux des patients pris en charge dans les établissements de santé : informations personnelles, résultats d’examens médicaux, comptes rendus chirurgicaux, protocoles thérapeutiques, etc. Il peut aussi s’agir de données issues de programmes de recherche. Leur recueil est encadré par le règlement général sur la protection des données (RGPD), un texte européen très protecteur transposé dans la loi française en 2018. Il stipule notamment que les personnes dont les données sont recueillies et utilisées à des fins de recherche doivent en être clairement informées et qu’elles ont un droit d’opposition à leur utilisation pour cette recherche. Seuls les médecins en contact avec les patients ont accès aux données personnelles, tous les autres ne peuvent travailler que sur des données anonymisées. Enfin, toutes ces informations étant sensibles, elles sont stockées dans des conditions strictes de sécurité par des hébergeurs (ou datacenters) certifiés par le ministère de la Santé.
Structurer et analyser les données
-
- Générer et enregistrer chaque jour des millions de données de santé de bonne qualité.
Générer et enregistrer chaque jour des millions de données de santé est une chose. Mais encore faut-il s’assurer qu’elles soient de bonne qualité et structurées.
Générer et enregistrer chaque jour des millions de données de santé est une chose. Mais encore faut-il s’assurer qu’elles soient de bonne qualité et structurées. À quoi servirait en effet une bibliothèque si les livres étaient incomplets ou rédigés en langues inconnues ?
« Aujourd’hui, les progrès informatiques nous permettent de remplir les bases indistinctement avec des données médicales structurées, des textes bruts, des résultats d’analyses, des données génomiques, peut-être un jour des images. Mais pour pouvoir ensuite travailler dessus, les bases doivent être correctement organisées. » Emmanuel Reyrat, Directeur du département des systèmes d’informations à Unicancer, qui réunit l’ensemble des centres de lutte contre le cancer.
« C’est l’objectif du projet ConSoRe mis en place par Unicancer. Il s’agit d’un système qui collecte, analyse et structure les données, associé à un moteur de recherche multicritère. Cela permet notamment à des médecins d’ identifier des patients répondant à des critères de recherche précis, de visualiser graphiquement l’évolution de leur maladie et leurs traitements, de localiser des dossiers de cancers rares, de savoir si des cas similaires ont déjà été traités ailleurs. L’objectif de ConSoRe est de faciliter la recherche d’ informations et leur partage entre médecins et chercheurs de différents centres de lutte contre le cancer. »
Du fait de leur volume et de leur fragmentation, analyser les données de santé n’est pas toujours simple. Pour cela, les chercheurs utilisent notamment l’intelligence artificielle (IA). Ce terme regroupe différentes méthodes de programmation informatique qui imitent des modes de raisonnement propres aux humains. On distingue l’IA « faible », qui repose sur des algorithmes mis au point par l’homme et permettant à une machine d’exécuter une tâche comme par exemple établir un diagnostic ou proposer une thérapeutique en fonction de critères prédéfinis. L’IA « forte » a pour but de créer des programmes permettant aux machines d’apprendre par elles-mêmes le bon algorithme : on parle de machine learning. Plus la machine s’entraîne et plus elle est capable de reproduire le raisonnement humain, à condition de lui avoir fourni au départ les bons exercices avec les corrigés. L’objectif est que les algorithmes fassent des rapprochements, par exemple des similitudes moléculaires ou génétiques entre des cancers touchant des organes très différents, auxquels un médecin n’aurait pas forcément pensé.
Publié par Émilie Gillet le 14 mai 2019, sur https://curie.fr/
Des perspectives pour les malades
-
- De nombreux laboratoires de recherche se sont emparés de ces nouveaux outils d’IA.
De nombreux laboratoires de recherche se sont emparés de ces nouveaux outils d’IA.
Récemment, plusieurs équipes internationales ont ainsi mis au point des algorithmes capables de diagnostiquer un mélanome. Les programmes ont d’abord appris à reconnaître un mélanome en examinant et en comparant des dizaines de milliers d’images de lésions cancéreuses et de simples grains de beauté, puis ont été capables d’identifier des tumeurs atypiques avec plus de réussite que des médecins.
« IRM, mammographie, TEP scan… Les images sont des données extrêmement intéressantes aujourd’hui pour l’IA, car elles contiennent énormément d’ informations. Si elles sont de qualité, et associées à des dossiers cliniques bien renseignés, c’est une excellente base de travail. Qui plus est, les algorithmes permettent de gommer les variations d’ interprétation qui existent entre deux médecins. Les programmes apprennent seuls à faire des rapprochements. Cela permet de défricher énormément de données et de découvrir de nouvelles pistes de recherche. » explique Irène Buvat
Avec la même approche, une équipe Inserm-Université Paris Sud a ainsi suggéré qu’il pourrait être envisageable de prédire la réponse à l’immunothérapie de certaines tumeurs solides à partir d’une simple image scanner. Une autre, au Centre de recherche des Cordeliers, à Paris, a développé un algorithme qui pourrait déterminer à l’avance les patients ayant une réponse complète à la radiochimiothérapie afin de leur éviter une opération pour un cancer du rectum. De telles avancées devraient aussi être possibles à partir de données moléculaires ou génétiques. Certaines équipes utilisent encore l’IA pour analyser des milliers de génomes dans le cadre de la recherche sur les cancers rares ou pour déterminer de nouvelles cibles thérapeutiques par exemple.
-
- Les données de santé à l’Institut Curie.
Publié par Émilie Gillet le 15 mai 2019, sur https://curie.fr/
Ethique et garantie humaine
-
- Ethique et garantie humaine
En novembre 2020, le Comité consultatif national d’éthique (CCNE) s’est exprimé à propos de l’intelligence artificielle dans le domaine de la santé.
En théorie, data et intelligence artificielle permettent d’ouvrir de nombreuses voies de recherche, déclare Irène Buvat. Mais nous devons être très vigilants quant à la rigueur de notre travail si nous ne voulons pas faire naître de faux espoirs ! Par ailleurs, l’objectif n’est surtout pas de remplacer les médecins mais de les aider, de faire en quelque sorte de la ”médecine augmentée“.
Selon le rapport du Comité consultatif national d’éthique (CCNE), « le risque principal serait de ne pas avoir suffisamment recours à l’IA, explique David Gruson, codirecteur du groupe de travail du CCNE. Nous avons beaucoup de données de santé en France, il ne faudrait pas les sous-exploiter. » Un autre risque important serait de surréglementer ce secteur.
« Le RGPD est déjà suffisamment protecteur. » Le rapport souligne aussi deux autres risques inhérents à l’IA. Celui de la tension entre individus et collectif : la logique de santé publique, notamment d’un point de vue économique, n’est pas toujours compatible avec celle qui prime à l’échelle de la santé d’une personne. Nous devons anticiper ce risque avec des législations particulières qui obligeraient par exemple les médecins à informer leurs patients qu’ils ont 14 utilisé un algorithme pour établir un diagnostic ou faire un choix thérapeutique.
Enfin il convient d’établir un principe de garantie humaine de l’IA : que le sens critique de l’être humain prédomine toujours par rapport à la machine ! Un enjeu que le mathématicien et député Cédric Villani a bien pris en compte lorsque, rendant son rapport sur le développement de l’IA en France en mars 2018, il a déclaré :
« L’enjeu n’est pas la compétition entre deux intelligences mais au contraire leur association ; comment l’intelligence humaine pourra utiliser l’intelligence de synthèse pour se faciliter la tâche. »
Publié par Émilie Gillet le 15 mai 2019, sur https://curie.fr/
Grâce à vous - la campagne MC21 pour le projet big data
-
- Grâce à vous - la campagne MC21 pour le projet big data
Avec un centre de recherche de renommée internationale et un ensemble hospitalier de pointe produisant chaque jour de très grandes quantités de données, l’Institut Curie occupe une position de leader dans l’utilisation du Big Data au service de la lutte contre le cancer.
Lancée en novembre 2017, la campagne MC21 (Marie Curie XXIe siècle) est une campagne de collecte destinée à soutenir le financement de quatre projets essentiels et innovants portés par l’Institut Curie. Parmi ces projets, le développement du big data figure en bonne place avec un besoin de financement à hauteur de 10 millions d’euros d’ici à 2021.
Porté par un comité de campagne composé de 12 membres très impliqués tant personnellement qu’à travers leurs réseaux, la campagne a déjà permis de collecter près de 4 millions d’euros. Grâce à la campagne MC21, l’une des premières entreprises à s’être associée à la campagne est le groupe Bessé-Conseil en assurances, qui s’est engagé dans le soutien du projet big data sur plusieurs années. « L’objectif de notre engagement auprès de l’Institut Curie est de rendre un service immédiat aux patients atteints de cancer et de se préoccuper de l’avenir en poussant plus loin le progrès scientifique au bénéfice du plus grand nombre », déclare Pierre Bessé, président du groupe.
Publié par Émilie Gillet le 15 mai 2019, sur https://curie.fr/
Trois questions à Xosé Fernandez, directeur des data à l’Institut Curie
-
- Xosé Fernandez, Directeur des data à l’Institut Curie.
Xosé Fernández a rejoint l’Institut Curie en juin 2017, en tant que Directeur des Data. Sa mission ? Structurer la gestion et l’utilisation des bases de données de l’Institut, pour obtenir un nouvel éclairage sur les maladies et, ainsi, faire progresser les traitements.
Quelle est l’importance des data à l’Institut Curie ?
Dès l’an 2000, l’Institut Curie a commencé à numériser les dossiers médicaux de ses patients, et en 2004 nous avons complètement abandonné le papier : données personnelles, comptes rendus d’examens, d’opérations, analyses génétiques… mais aussi toutes les données issues de la recherche, tout est informatisé ! Nous avons été le premier centre français de lutte contre le cancer à adopter cette stratégie du ”tout numérique“, puis à créer une Direction des data.
Vous dirigez cette Direction des data. Quels sont ses rôles ?
L’objectif principal est de tisser des liens étroits entre la clinique et la recherche, c’est-à-dire permettre aux chercheurs d’utiliser ces données au mieux pour découvrir de nouvelles pistes thérapeutiques, par exemple, ou optimiser le diagnostic des cancers. Pour cela, nous devons réfléchir à la meilleure façon de classer ces données, de les structurer, afin qu’elles soient accessibles le plus facilement possible.
Vous réfléchissez aussi aux outils à développer pour les analyser…
Oui, grâce à des partenariats avec d’autres équipes de recherche mais aussi avec des entreprises privées, nous mettons au point des outils d’intelligence artificielle pour exploiter au mieux ce volume considérable d’informations. En parallèle, nous travaillons à la rédaction d’une charte qui définira précisément la protection de ces données et les utilisations que nous pouvons en faire. Grâce aux data et à l’intelligence artificielle, nous sommes à la veille d’une grande révolution dans la prise en charge des cancers.
Publié par Émilie Gillet le 15 mai 2019, sur https://curie.fr/
Pour en savoir plus :
5 biotech qui s’attaquent au cancer le 7 février 2018 à Paris
Innovation santé : « La France ne doit pas rater le coche ! » Maryvonne Hiance, le 13 juillet 2018
Contre le Cancer, la puissance des DATA le 14 mai 2019,
La start’up Sideros reçoit un financement de 500 000 € pour lutter contre les rechutes et les métastases dans le cancerle le 06 juin 2020