Big Data en santé Etienne Minvielle Directeur de l’EA 7348 Management des Organisations en Santé Ecole des Hautes Etudes en Santé publique « Révolution numérique », « Mort de la mort », « Disparition des médecins au profit de l’outil numérique », les expressions spectaculaires ne manquent pas pour annoncer la révolution du Big data dans le domaine de la santé. Généralement, ce type d’affirmation entraîne une certaine méfiance. L’histoire est jalonnée de cas où les annonces n’ont pas été suivies des résultats escomptés. Des effets de mode se glissent. Des effets inattendus surviennent. La substitution des pratiques traditionnelles par les nouvelles se heurte à des résistances mal appréhendées. En un mot, le passé des analyses du futur a souvent été bien cruel pour ses auteurs. En dépit de ces réserves, on serait pourtant tenté de croire que nous sommes dans le cas du Big data et de la santé numérique face à une véritable innovation de rupture. Elle en possède au moins deux attributs. D’une part, sa diffusion dans le secteur de la santé (comme dans d’autres) s’établit à une vitesse jamais observée. D’autre part, cette introduction ouvre à des horizons nouveaux. La capacité à traiter de larges bases de données sur le génome fait émerger de nouvelles connaissances sur les risques de développer une maladie, notamment. Fait important, toutes ces perspectives dessinent les contours d’une « destruction créative » du système de santé : nouvelle forme de médecine prédictive fondée sur la connaissance du patrimoine génétique, nouveau comportement du patient, autonome vis-à-vis de son médecin dans la prise en charge de sa santé, nouvelles formes d’organisation des soins fondées sur des échanges à distance. En toile de fond se devinent également de grands débats éthiques à venir sur les formes de solidarité et la liberté individuelle induits par l’irruption de ces nouvelles technologies. En s’appuyant sur un travail prospectif réalisé en collaboration avec le Centre de Recherche en Gestion de l’école Polytechnique (Minvielle, Marrauld, Dumez, Etat des lieux de la santé numérique, Novembre 2015, Mutualité française-Fondation de l’Avenir), quatre domaines, spécifiquement au Big Data en santé, sont identifiables : Soutien à l’intégration de l’offre de soin Le Big Data présente une valeur économique et clinique dans le développement des offres de soin intégrées. Il peut tenir dans les échanges entre professionnels et entre professionnels et patients via de systèmes de télémédecine et d’outils connectés. L’ensemble contribue à orienter et accompagner le patient durant son parcours. Il faut ajouter l’apport du Big Data dans l’utilisation de systèmes de décision médicale qui joue sur l’automatisation de l’analyse des imageries et de la littérature médicale (comme par exemple, le logiciel « Uptodate »). De même, le Big Data introduit une valeur nouvelle par sa capacité à automatiser les processus de production. Précisément, le Big Data offre aux organisations la possibilité de traquer et d’étiqueter l’origine et l’utilisation des données dans tous les processus de production de service. Les applications sont potentiellement nombreuses, allant de la gestion de services techniques comme la stérilisation, à la gestion des rendez-vous, en passant par la traçabilité en matière de matériovigilance. Service de prévention personnalisée, Evaluation Comportementale et Prédiction Le Big Data permet de détecter des modèles comportementaux ou de profils patients plus imperceptibles à petite échelle. Par exemple, en utilisant un logiciel de prédiction en temps réel, il est possible de déceler, via les réseaux sociaux ou téléphones mobiles, des tendances suicidaires chez les vétérans de guerre. Le Big Data joue également sur la capacité à traiter le génome humain développant une nouvelle médecine dite prédictive. De ce fait, le risque encouru de développer une maladie ou de la voir s’aggraver devient de plus en plus connu, entraînant la possibilité de développer des services de prévention personnalisée. La médecine dite de précision est un des enjeux forts actuels dans de nombreuses activités médicales. Précisément, l’objectif est de collecter des données sur le génome, de les combiner avec d’autres types de données, à des fins à la fois de prédiction de survenue d’une maladie, et de développement de thérapies ciblées. Des applications existent déjà, dans le cancer notamment. Elles offrent une possibilité de considérer des pratiques médicales différentes, notamment par l’intrusion de « data analysts » aux côtés des médecins traditionnels, dont le rôle dans la définition des stratégies diagnostiques et thérapeutiques pourrait être majeur. Le Big Data peut aussi avoir une capacité à évaluer le risque et le comportement des assurés dans la gestion de sa maladie ou en matière de prévention. Les intérêts sont, dans ce domaine, multiples. Ils peuvent notamment améliorer la connaissance du risque individuel avec toutes les retombées au niveau de la couverture assurantielle. La disparition de l’aléa moral autour du risque modifie les comportements entre l’assureur et l’assuré. L’assureur peut être tenté de sélectionner les profils à faible risque. Mais l’assuré peut aussi sélectionner une assurance en fonction de la connaissance de son risque : faible coût si le risque est faible, large couverture en cas de risque élevé. La personnalisation du contrat d’assurance en fonction du risque renvoie à de nouveaux comportements dans lesquels des équilibres sont à trouver. Le patient autonome Le patient est de plus en plus acteur de sa santé via les outils connectés et les forums communautaires. Le Big Data peut permettre d’aider le patient dans sa démarche d’autonomie, notamment par sa capacité à proposer des services d’analyse comparée avec d’autres patients atteints de maladies similaires, ou confrontés aux mêmes questions de santé. Les plateformes « opensource » sont ainsi souvent proposées afin d’aider les utilisateurs volontaires dans leur démarche, et font l’objet de développements spécifiques en santé. Mais on peut suspecter des usages des données ainsi remontées par les opérateurs de ces plateformes autres que le service de partage de données proposé. Dans le cas de 23andme, les données remontées par les patients sur les effets de toxicité de certains médicaments sont ensuite revendues à des laboratoires pharmaceutiques. Cet exemple témoigne de l’apparition d’un nouveau modèle où le service procuré est offert, ce qui le rend très attractif pour l’utilisateur, mais n’est pourtant pas tout à fait gratuit dans la mesure où l’utilisateur délivre des données sur son comportement, ses habitudes et son état de santé. La relation entre le patient et l’opérateur peut y apparaître déséquilibrée en ce sens qu’elle est transparente dans un sens (le client livre beaucoup de lui-même via ses courriels et requêtes Internet) et très opaque dans l’autre (comment accéder aux usages que l’opérateur connait de lui ?). L’accompagnement du patient dans sa démarche d’autonomie engage donc une certaine transparence, voire de confiance, quant à l’usage fait des données. Evaluation à l’échelon populationnel Le Big data peut aider à alerter sur des phénomènes épidémiques (Type H1N1) émergents avec des modèles prédictifs, semble-t-il, robustes. Sur le plan de la recherche évaluative, le Big data peut aussi contribuer à renouveler les évaluations médico-économiques sur la consommation des soins avec le stockage et le traitement de données d’un nouveau type (notamment remontées directement par les patients, selon le mouvement du patient-driven data). Il ressort d’une manière transversale que le Big Data dans le domaine de la santé se décline par la capacité à collecter des données de nature variable, et de les stocker. L’enjeu est fort car les systèmes de données sont actuellement le plus souvent éparpillés. Les traitements de données s’appuient sur des algorithmes qui offrent des capacités jusqu’à maintenant inenvisageables. Il est aussi intéressant de souligner combien des systèmes d’apprentissage permettent d’emmagasiner une connaissance au fur et à mesure de l’évolution de ces outils de traitement qui rendent leur prédiction de plus en plus précise. En termes de méthodes d’analyse, les méthodes statistiques traditionnelles sont susceptibles d’être challengées avec l’avènement des traitements issus du Big Data. Ces derniers traitements sont susceptibles de surmonter les questions liées à la limite des tailles d’échantillon et à la définition d’hypothèses d’efficacité. Ils apparaissent plus ouverts, voire totalement « non supervisés », lors de la recherche des hypothèses de corrélation entre des variables et un résultat de santé.