La notion de données personnelles : les données appliquées à la santé et le big data. INTRODUCTION : 1. Définition Les données personnelles sont des informations sur les personnes physiques recueillies pour satisfaire différents objectifs, administratifs, sécuritaires et de plus en plus commerciaux. Ces informations permettent d’identifier les personnes de manière directe ou indirecte. Par exemple une carte d’identité est une information identifiant directement une personne, un numéro de téléphone permettra indirectement de remonter jusqu’à son titulaire. Mais au-delà de l’aspect nominatif, les informations peuvent renseigner sur des caractéristiques propres à la personne: sa profession, sa situation familiale, et comme nous allons le voir plus particulièrement son état de santé. La notion de données personnelles est donc très large, et toute information, dès lors qu’on peut la rattacher directement ou indirectement à une personne, devient une donnée personnelle. Ainsi, le nom, le prénom, la photo, le son de la voix, l’adresse, le numéro de téléphone, de carte bancaire, ou encore le numéro de sécurité sociale sont des exemples de données personnelles parmi d’autres, de même que les informations relatives aux gouts, comportements, habitudes des personnes, qui sont des données utilisées notamment pour constituer des fichiers de consommateurs. La notion même de donnée, « représentation conventionnelle d’une information », nous allons le voir, trouve son aboutissement dans le contexte de l’informatique. La donnée est l’information informatisée, traitée par le langage informatique, numérisée. Ainsi, la question des données personnelles s’est développée avec l’informatisation des renseignements. Cela a entrainé le vote de la loi n° 78- 17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés qui définit dans sa dernière version la donnée comme « toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres. Pour déterminer si une personne est identifiable, il convient de considérer l’ensemble des moyens en vue de permettre son identification dont dispose ou auxquels peut avoir accès le responsable du traitement ou toute personne » La loi a vocation à s’appliquer aux traitements de données personnelles qui sont définis comme toute opération ou tout ensemble d’opérations portant sur telles données, quel que soit le procédé utilisé, et notamment la modification, l’enregistrement, l’organisation, la conservation, l’adaptation ou la modification, l’extraction, la consultation, l’utilisation, la communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction. Le traitement de ses données est, en général, une organisation des informations collectées dans une base de données personnelles dans ce contexte doit être perçue comme l’ensemble des moyens techniques, juridiques et administratives mis en œuvre pour permettre d’assurer l’intégrité des données personnelles constituées, afin d’éviter leur détournement et d’une manière toute utilisation abusive. Certes, le problème des données personnelles s’est développé avec l’évolution de l’informatique, cependant le fond du problème ne tire pas sa source de l’informatique, celuici n’étant qu’un outil pour traiter les informations et par là un même facteur d’aggravation des atteintes à la vie privée. Les dérives dans l’utilisation des données personnelles ont une origine bien lointaine, les bases de données, ou plus précisément les fichiers d’informations, ont en effet précédé l’informatique. L’affaire des fiches est l’archétype du traitement d’informations personnelles abusif en ce qu’il regroupe des données qu’on nomme aujourd’hui les données « sensibles ». Dans le cadre de ce sujet, l’accent sera mis sur la notion de données de santé. Celles-ci font l’objet d’une protection particulière. Les données personnelles dans le domaine de la santé doivent être recueillies à des fins utilitaires, c’est pourquoi elles doivent être pertinentes quant à l’objectif poursuivi. Dès lors que les données ne sont plus pertinentes, elles deviennent « à risque » dans le sens où leur réelle utilité n’est pas connue. A juste titre, ce risque concerne surtout les données dites sensibles dont l’utilité apparait douteuse, voire dangereuse. Il s’agit des données concernant l’opinion religieuse, politique, syndicale, l’origine ethnique, l’orientation sexuelle etc. Ainsi comment est assurée la protection de ses données et quel régime appliquer ? Il est ainsi opportun de tracer le cadre de protection de ces données personnelles de santé (I) avant d’étudier les exceptions à ces protections (II), enfin le recueil des données via big data appliqué à la santé(III). I. Les données personnelles : par principe protégées. A. La protection des données de santé à caractère personnel. 1. Traitement des données sensibles Les données personnelles sont des fragments de vie privée. C’est pourquoi elles sont avant tout protégées au nom du droit au respect de la vie privée. Ce principe est vis é par plusieurs déclarations, recommandations et textes spécifiques mais aussi par des conventions internationales notamment la convention européenne de sauvegarde des droits de l’homme et des libertés fondamentales (CEDH) du 4 novembre 1950, mais aussi à l’article 9 du code civil : « chacun à le droit au respect de sa vie privée… ». Le conseil de l’Europe a également élaboré la convention pour la protection des personnes physiques à l’égard des traitements des données à caractère personnels. (directive N°95/46) Toutes ces lois, recommandations et textes spécifiques sont en effet basés sur des valeurs relatives à la vie privée notamment les traitements dits sensibles. Les données sensibles sont des traitements qui recueillent des informations susceptibles de porter atteinte aux libertés individuelles. Ce sont les informations dites sensibles relatives aux opinions syndicales, politiques ou religieuses ou faisant référence à l’origine ethnique ou l’état de santé. Les données relatives à la santé sont sensibles puisqu’une discrimination sur l’état de santé est aisément imaginable surtout dans le cadre du travail. Selon un arrêt du 25 avril 2013 de la cour de cassation les discriminations sur l’état de santé sont interdites au travail et ne peuvent constituer un motif de licenciement. Cependant on a estimé que ces données pouvaient être utiles à des fins médicales tant que cela ne s’étendait pas au-delà du champ curatif. Les professionnels de santé ont toujours accès à ce type d’information et leur confidentialité est normalement garantie par le code de la santé publique. Le problème demeure que l’informatisation d’un fichier permet son développement son échange et ce, plus facilement qu’un fichier papier. Ainsi, le fait que des données privées aussi importantes que celles relative à la santé fassent l’objet d’une collecte et d’échange par à la fois une administration publique(les hôpitaux), et agents privés (laboratoires ou cliniques) peut difficilement rassurer les personnes concernées. Cette question a connu d’ailleurs un renouveau récent avec le projet de carte vital. La première carte vitale n’était qu’une carte d’identité sociale, avec la vitale 2, sont accessibles les données médicales personnelles des patients. Cette concentration des informations chez les professionnels de santé risquerait d’engendrer des dérives commerciales si les données étaient transmises aux labos ou aux acteurs de l’industrie pharmaceutique. C’est pourquoi, la loi du 13 aout 2004 a créé le dossier médical personnel qui permet aux médecins l’accès en ligne, via la carte vitale, aux données médicales des patients. 2. Les difficultés liées a la collecte des données sur internet Internet a littéralement bouleversé la protection des données personnelles. Internet étant un vecteur de diffusion rapide d’information à l’échelle mondiale, on ne peut l’utiliser sans qu’il existe un risque de propagation des données personnelles. Internet comprend alors un paradoxe surprenant car d’un côté il s’agit d’un système de haute technologie qui permettant une parfaite traçabilité des utilisateurs. D’un autre côté, le haut niveau technique n’empêche le risque de perte de contrôle des données y circulant quant à leurs destinataires et quant à leurs utilisations. Les nouveaux moyens techniques permettent la collecte de données de manière rapide, efficace, mais aussi discrète puisque souvent l’internaute ne s’en aperçoit pas. Certaines informations sont quand même recueillies avec le consentement de l’internaute, mais il ne se rend toujours pas compte de leur portée. En effet un internaute peut être amené à remplir des formulaires dont les objectifs sont précis, dans ce cas, il en saisit toute la portée. Mais des informations peuvent aussi être collectées et utilisées à partir de conversations. D’autres informations sont recueillies plus insidieusement à l’insu de l’internaute, afin de l’identifier et de connaitre ses habitudes. C’est le cas des fameux cookies par exemple. Les cookies sont des témoins de connexion, des mouchards déposés sur le disque dur de l’internaute, par le gestionnaire d’un site d’un site, sous forme de fichiers demeurant après la déconnexion et enregistrant des données sur les caractéristiques techniques de l’ordinateur, les logiciels installés et utilisés, les sites et p âges consultées. Lors de la connexion suivante, les données des cookies sont ramenées vers le créateur qui peut les exploiter par voie de spam par exemple. Les fournisseurs d’accès internet utilisent aussi ces outils, et il est arrivé que certains (géocities aux USA) revendent les informations via les cookies, sur leurs abonnés à des entreprises marketing. Les cookies, doivent, comme tout traitement, être subordonnés au consentement de la personne concernée, l’introduction clandestine de cookies étant pénalement sanctionnée, le responsable du traitement doit informer les personnes de l’objet de la collecte et de la faculté dont elle dispose de s’y opposer. En pratique le recueil du consentement est très rare, d’autant que les logiciels de navigation sur le réseau sont par défaut configurer pour laisser entrer les cookies. Il est possible de les configurer pour détecter et ou bloquer ceux-ci, mais il se trouve que le refus pénalise la navigation, voire empêcher l’internaute d’accéder au site. Accepter les cookies parce qu’il est nécessaire pour entrer sur le site, est ce exprimer un consentement libre ? Cette pratique est intolérable et porte atteinte à une sorte de liberté virtuelle d’aller et de venir. Et appliquée aux données de santé, cette problématique peut s’avérer très dangereuse. En effet, de plus en plus de laboratoire en ligne se développent. Ces laboratoires proposent des services permettant de pratiquer des tests génétiques en ligne. Des informations personnelles et médicales sont ainsi communiquées et mises en ligne, et bien que celles-ci ne soient pas publiques, elles pourront être récupérées via ces fameux cookies. Sur le sujet, la CNIL a donné quelque recommandations afin de limiter ce genre de collecte d’informations à notre insu, notamment protéger l’ordinateur par un mot de passe, éteindre après utilisation, mettre un antivirus, installer et para feu etc. B. Le secret médical et le principe d’anonymat 1. le secret médical 1.1 les sources du principe La règle du secret fait partie des traditions médicales les plus anciennes. Il a été clairement énoncé dans le serment d’Hippocrate au Ve siècle avant J-C :" Quoi que je voie ou entende dans la société pendant l'exercice ou même hors de l'exercice de ma profession, je tairai ce qui n'a jamais besoin d'être divulgué, regardant la discrétion comme un devoir en pareil cas". Le secret constitue une valeur incontournable de la relation du médecin avec le patient car il est le socle de la confiance. Le patient doit avoir la certitude que toutes les informations confiées à son médecin et dont il est le maitre seront strictement protégées « sous le sceau du secret ». 1.2 l’affirmation du secret médical par la jurisprudence En effet, la Cour de Cassation avait admis, en 1885 déjà, que le secret médical revêtait un caractère général et absolu (Cour de Cassation, arrêt 1885 « Watelet ») Elle avait réitéré sa position, avec plus de certitude encore, dans un arrêt de la Chambre Criminelle en date du 8 mai 1947 « Degraene ». Les chambres civiles (1ère civ 22 mai 2002) et le Conseil d’Etat (arrêt d’assemblée du 12 avril 1957- Deve) en ont jugé de même (avec toutefois un peu plus de nuance). Certaines conséquences en découlent : - Le patient ne peut pas délier le médecin de son devoir au secret Le secret s’impose même après le décès du patient Le secret s’impose même devant le juge Le secret couvre non seulement l’état de santé du patient mais également son nom Etc. Par ailleurs, la Cour Européenne des Droits de l’Homme, dans une décision du 27 août 1997, a expressément rattaché le secret médical au droit à la vie privée affirmé par l’article 8 de la CEDH. 1.3 L’affirmation du secret médical par la loi Cette obligation professionnelle est imposée aujourd’hui par de multiples sources : Tout d’abord, le principe est consacré dans le Code de Déontologie médicale. L’article 4 dispose que « Le secret professionnel, institué dans l'intérêt des patients, s'impose à tout médecin dans les conditions établies par la loi. » Il recouvre toutes les informations parvenues au médecin durant l’exercice de sa profession (ce que le patient lui a confié mais étalement ce qu’il a pu voir, entendre et déduire luimême). L’article L. 1110-4 du Code de la Santé publique également consacre ce principe : « Toute personne prise en charge par un professionnel, un établissement, un réseau de santé ou tout autre organisme participant à la prévention et aux soins a droit au respect de sa vie privée et du secret des informations le concernant ». Enfin l’article 226-13 et 226-14 du Code Pénal énonce les sanctions encourues en cas de violation du secret médical : « La révélation d'une information à caractère secret (…) est punie d'un an d'emprisonnement et de 15 000 euros d'amende ». Exemples de données protégées : Parmi les informations soumises au secret médical on retrouve le dossier médical du patient. Il s’agit d’un est un support pratique pour les professionnels de santé pour retrouver la trace des interventions du patient. Il a pour fonction de garantir la continuité, l’efficacité, et la sécurité des soins. Il y a une traçabilité. C’est aussi el lieu de recueille du consentement du patient 2. Les données nécessitant l’anonymat Au delà du secret médical, et de la confidentialité des données médicales personnelles, l’anonymat est prévu par les textes dans certaines situations : - D’une part avec des gamètes hexogène (c’est à dire d’un autre couple) dans le cadre des dons de gamètes, ou dans le cas de transfert d’embryon lors d’une PMA - D’autre part par la mise au monde de notre propre enfant, mais cette fois ci dans une optique de le faire adopter, il s’agit du cas de l’accouchement sous X. Pour ces présents cas, les données personnelles si elles sont connues n’entrainent pas qu’une simple atteinte au secret médical et à la confidentialité des données mais peuvent avoir des conséquences plus importantes, c’est pourquoi il a fallu mettre en place le principe d’anonymat. 2.1 La PMA et le don de gamète Il faut tout d’abord savoir que deux grands principes éthiques sous tendent à l’organisation du don d’organes et des produits du corps humain : ce sont les règles d’anonymat et de gratuité. En matière de don de gamète, les premiers CECOS (qui sont les centres pratiquant ses actes) mirent en place un code éthique dans lequel la gratuité et l’anonymat figuraient au premier rang des règles appliquées par les centres. Une 20 aine d’années plus tard, les lois du 29 juillet 1994 ont consacré les principes d’anonymat et de gratuité cette fois-ci en matière de don d’organe et de produit du corps humain. Le principe de l’anonymat se retrouve ainsi inscrit à l’article 16-8 du code civil, parmi les grands principes du droit de la biomédecine, eux même fondés sur le principe constitutionnel de la sauvegarde de la dignité humaine. Celui-ci est par ailleurs est prévu par le code de santé public à l’article 1211-5 dans la première partie du code relatif aux dons et l’utilisation des éléments et produits du corps humain. On peut soulever une remarque, en effet, les dispositions relatives à l’anonymat des dons d’organes, de tissus, de cellule et de produits ne sont assorties d’aucunes sanctions pénale, en revanche concernant le don de gamète l’article 511-10 du code pénal, reproduit à l’article 1273-3 du CSP, prévoit une peine de 2 ans d’emprisonnement et de 30 000 euros d’amende pour « le fait de divulguer une information permettant à la fois d’identifier une personne ou un couple qui a fait don de gamètes et le couple qui les à reçus » Dans le même esprit, l’article L 2141-6 du CSP, relatif à l’accueil d’embryon dispose que « le couple accueillant l’embryon et celui y ayant renoncé ne peuvent connaître leurs identités respectives » et le code pénal puni le fait de divulguer cette information nominative. On peut ainsi se poser la question de savoir pourquoi est il opéré une distinction concernant la divulgation des informations personnelles entre ses différents dons ? Contrairement au dons de sang ou d’organes, le don de gamète ou le transfert d’embryon est porteur de vie humaine, conduit à la procréation et ainsi à l’intervention d’un tiers dans la relation de don. En effet, on craint tout d’abord la raréfaction des dons d’une part puisque le donneur ne veut pas forcément que son identité soit révélée, on éviter ainsi la possibilité d’envisager l’engagement d’une action qui tendrait à établir un lien de parenté entre le donneur et l’enfant né du don. Cette impossibilité est toutefois expressément prévue par l’article 31119 du CP. D’autre part la règle de l’anonymat des données personnelles est fondée sur la priorité donnée à la filiation affective sur la filiation génétique, sur l’idée que dans la conception d’un enfant, la dimension affective du désir est plus importante que la dimension génétique. On veut ainsi préserver l’équilibre familial. Par comparaison, on remarque qu’il est possible dans certains pays de l’union européenne de connaître l’identité des donneurs comme en Espagne, en suède. Mais également en Belgique ou la levé est une option. Et enfin en Allemagne ou la levée de l’anonymat peut avoir des effets cette fois-ci sur la filiation. 2.2 L’accouchement sous X Nous allons désormais parler de l’accouchement sous X. Par principe en France une femme qui choisit d’accoucher sous X peut garder l’anonymat. Et le Conseil constitutionnel, saisi d’une question prioritaire de constitutionnalité par un enfant abandonné, a jugé conforme à la Constitution ce texte de loi limitant l'accès aux données personnelles de la mère, aux enfants nés sous X. Cependant, Dominique Bertinotti, ministre de la famille envisage la fin de l’anonymat des naissances sous X au 18 ans de l’enfant. Le conseil des ministres devrait avoir connaissance du projet de loi famille fin mars ou début avril pour un vote prévu au second semestre 2014. L’identité de la mère serait alors dévoilée au 18 ans de l’enfant si celui ci en fait la demande. Dans ce même projet est envisagé également une éventuelle levée de l’anonymat des donneurs de gamète. II. Les exceptions liées à la protection des données personnelles de santé Dans cette partie, nous allons voir les exceptions au principe de la confidentialité des données de santé. Or on peut se demander à quel titre est ce qu’on peut déroger à ce principe fondamental de protection de ces données, qu’est ce qui finalement justifie cette atteinte ? A. le droit d’information des personnes 1. Les exceptions au secret médical Dans certains cas le secret médical est rompu 1.1 Dans l’intérêt du patient Des dérogations au secret médical sont nécessaires : - pour soigner le patient : notamment le secret partagé par l’équipe médicale pour une meilleure prise en charge (article L 1110-3) - concernant les soins psychiatrique sur demande d’un tiers - pour protéger la personne (majeur protégé) - si une personne a besoin d’être protégé (personne battue) - pour faire valoir ses droits (accident du travail) 1.2 dans l’intérêt de la société Dans un but de santé publique avec les déclaration obligatoire de maladie contagieuse. Ces maladies sont prévues à l’article L 3113-1 du CSP qui impose la transmission obligatoire à l’autorité sanitaire de données individuelles dans le cas des maladies qui nécessite une intervention urgente locale, nationale, voir internationale. Ainsi que les maladies dont la surveillance est nécessaire à la conduite et à l’évaluation de la politique de santé publique. Le médecin qui a traité la maladie est dans l’obligation de faire part de ce cas de maladie à son référant (l’ARS) qui elle même en fait par au ministère de la santé, qui le transfert a l’INSERM qui la collecte. La liste des maladies est fixée par le code de la santé public, il en existe 31. Ce dispositif est très important et permet de ne pas passer à coté d’une maladie contagieuse ou d’un produit qui a causé des maladies : la rougeole car contagieuse, la variole, la tuberculose, le VIH, le botulique (qui se trouve dans la nourriture), le charbon (bactérie infectieuse transmis par voie cutanée), le chicungounia, la dingue, la diphtérie, la fièvre typhoïde, l’hépatite aigue A, la légionellose contamination par l’eau en respirant, la listériose, la peste noire, la poliomyélite, la rage, le saturnisme chez l’enfant entrainant une dégénérescence cognitive, la maladie de crowsfel jacob, le tétanos, le typhus. Le but est vraiment de cibler les maladies qui sont transmissibles, ou transmissibles par une chaine humaine ou alimentaire, savoir par exemple quand on doit retirer un fromage, un lait, un restaurant, une eau, ou une personne malade qui est contagieuse. 1.3 Dans l’intérêt de la famille : l’information sur les maladies génétiques obligatoire au membre de la famille de la personne atteinte Le seul destinataire de l'information est en principe le patient. S'agissant des maladies génétiques, la loi de 2002 s'est préoccupée de l'information du patient, mais aussi et surtout de l'information de la famille. L'article 5 de la loi relative à la bioéthique du 6 août 2004 avait prévu qu'en cas de diagnostic d'une anomalie génétique grave, posé lors de l'examen des caractéristiques génétiques d'une personne, le médecin devait l'informer des risques que son silence pourrait faire courir aux membres de sa famille potentiellement concernés, dès lors que des mesures de prévention ou de soins peuvent leur être proposées. La personne concernée pouvait alors choisir d'informer elle-même sa famille ou utiliser la procédure de l'information médicale à caractère familial. Dans ce cas, elle indiquait au médecin le nom et l'adresse des membres de sa famille dont elle disposait, en précisant le lien de parenté qui les unissait. Ces informations étaient transmises par le médecin à l'Agence de la biomédecine qui informait, par l'intermédiaire d'un médecin, les membres de la famille de l'existence d'une information médicale à caractère familial susceptible de les concerner et des modalités leur permettant d'y accéder. Un décret en Conseil d'Etat, après avis de la Cnil, devait organiser cette procédure ; il n'a jamais été pris. La nouvelle procédure retenue par la loi du 7 juillet 2011 relative à la bioéthique a donc visé à régler ces difficultés. 2. l’exception au principe de l’anonymat dans la PMA Etant donné que l’AMP repose sur une aide médicale, les médecins des centres d’AMP connaissent inévitablement les identités des donneurs et des couples receveurs, ne serait ce que pour vérifier si ces différents acteurs remplissent les conditions définies par la loi pour faire un don ou pour recourir à l’AMP. Ils sont ainsi amené a prendre connaissance d’un certain nombre de données d’ordre purement personnel sur la vie familiale, la motivation de leur démarches, la physiologie etc. l’origine ethnique, la couleur de peau, la taille, le poids, la couleur de cheveux, yeux, groupe sanguin sont par ailleurs constamment recherchés afin de choisir les gamètes du donneur en fonction de la morphologie et du groupe sanguin du couple receveur. De plus qu’un certains nombre d’antécédents médicaux personnels vont être recherché. Par ailleurs, le receveur peut être amené a connaître des information non identifiante. En effet, le principe d’anonymat comporte une exception en cas de nécessité thérapeutique. Les médecins pourront avoir accès aux informations permettant l’identification du receveur ou du donneur. Cependant cette information est non identifiante et ne peut être utilisé qu’en cas de nécessité thérapeutique pour des maladies susceptibles d’être prévenues. B. l’utilisation des données personnelles de sante a des fins de recherche L’article L1121-1 définit la recherche médicale comme l’ensemble des recherches organisées et pratiquées sur l'être humain en vue du développement des connaissances biologiques ou médicales pratiquées. On en déduit donc que la mise au point d’un procédé thérapeutique, qu’elle qu’en soit la forme (médicament, techniques de soin, chirurgie) passe nécessairement par une expérimentation sur l’être humain. L’homme normalement sujet de la médecine, devient à ce moment l’objet afin de faire progresser la science médicale. Il faut donc concilier la liberté de la recherche avec la protection des personnes. Ainsi elle peut trouver un premier appui dans l’article 4 de la Déclaration de 1789 selon lequel : « la liberté consiste à faire tout ce qui ne nuit pas à autrui » Ainsi les traitements ayant pour fin la recherche dans le domaine de la santé correspondent à la situation où un médecin a transmis les données sur la santé d’un patient (donc des données sensibles), à un chercheur. Ces traitements sont longtemps restés illégaux puisque contraires au secret professionnel qui incombent aux médecins. Cependant la CNIL a incité le législateur à instituer des règles claires conciliant libertés individuelles et progrès de la recherche. Ce dernier intérêt impliquant surtout des enjeux économiques pour l’industrie pharmaceutique. La loi du 1 juillet 94 N° 94.58 a finalement été votée et elle ajoute un chapitre au sein de la loi de 1978. Cette loi relative aux traitements des données ayant pour fin la recherche dans le domaine de la santé prévoit des exceptions à la protection des données personnelles de santé. L’information du patient peut être limitée par la loi L’accès aux données peut lui être refusé De même la conservation des données peut être prolongée pour des raisons diverses dont l’intérêt de la santé publique ou de la recherche scientifique Les traitements intéressant la sécurité publique ou la santé de la population relèvent normalement d’un régime d’autorisation par arrêté du ou des ministres compétents après avis motivé et publié de la CNIL. III. Le recueil de données via big data appliqué à la santé A. Le big data au service de notre santé 1. Définition C’est une notion assez difficile à expliquer. Pour comprendre la notion de Big data il faut comprendre tout d’abord que ces dernières années, le nombre de données circulant sur internet a littéralement exploser, l’humanité génère aujourd’hui en 2 jours plus de d’information qu’elle n’en a produit les 36 siècles précédents, selon une étude. Pour prendre un exemple parlant en 2012, Facebook a stocké à chaque minute 350 giga-octets de données générées par ses utilisateurs. Les réseaux sociaux sont d’ailleurs l’une des principales raisons de cette explosion des données produites (75% des données générées par les utilisateurs à titre personnel). L’accélération des débits de connexion internet et la démocratisation des appareils numériques (appareils photos, caméras, smartphones, tablettes, capteurs…etc.) expliquent également ce phénomène. Donc le Big data va permettre le traitement de ce qu’on appelle littéralement les « grosses données » Traiter une telle masse et une telle variété de données était impensable il y a quelques années. Aujourd’hui, cela est possible, et ouvre de nouvelles perspectives. En effet, en triant et en recoupant ces données, on peut créer de nouvelles statistiques pour analyser différemment certains phénomènes voire les prédire. C’est ce procédé que l’on appelle « Big Data » (en référence à la grande quantité de données analysées). 2. Des avancées prometteuses en santé En santé, le Big Data promet également beaucoup, notamment dans le domaine de l’épidémiologie, puisqu’il permet d’analyser des données sur des échantillons cliniques plus grands, voire de se passer d’échantillon et de laisser émerger des tendances que l’on n’aurait pas imaginées à l’avance. Par exemple, en 2009, en pleine pandémie de grippe H1N1, le ministère américain de la santé a demandé l’aide de Google. En localisant sur une carte la position la provenance des mots-clés tapés dans le célèbre moteur de recherche, les ingénieurs ont pu dessiner et finalement anticiper l’évolution de l’épidémie. Google Flutrends était né, et l’outil a depuis été utilisé pour suivre d’autres maladies comme la grippe ou la dengue. Mais plus les données étudiées sont fiables, plus les résultats seront pertinents. C’est pourquoi se pose la question de permettre l’accès à certaines bases de données existantes à des fins d’étude statistique. Le sujet est plus que jamais d’actualité, puisque la Ministre de la santé a reçu le 3 octobre dernier un rapport sur le sujet de la part de l’Inspection générale des affaires sociales (IGAS). Le « rapport sur la gouvernance et l’utilisation des données de santé » préconise notamment de simplifier l’accès pour les chercheurs au Système d’information inter-régimes de l’assurance-maladie (SNIIRAM) qui enregistre par an plus de 500 millions d’actes médicaux et 11 millions de séjours hospitaliers, et ce depuis 14 ans. Les pouvoirs publics ont agi avant même la parution du rapport, puisqu’un arrêté du 19 juillet 2013 assoupli l’accès au SNIIRAM pour l’Institut de veille sanitaire (InVS) et la Haute autorité de santé (HAS) pour leurs besoins statistiques. A souligner également, l’initiative de l’Institut national du cancer (INCa), qui met à la disposition des internautes depuis 2012 un certain nombre de données statistiques sur la maladie dans un but d’information et pour faciliter la recherche. Toutefois, il faut rester prudent. Les données de santé sont particulièrement intimes et donc sensibles. Un arsenal juridique très complet existe afin de garantir au citoyen la sécurité et la confidentialité de ses données de santé, loi n° 78-17 du 6 janvier 1978 dite « informatique et libertés » et code de la santé publique comme vu en introduction. Au-delà des moyens légaux, il existe également de nombreux moyens techniques pour protéger l’accès aux données de santé. L’une des missions de l’ASIP Santé est d’ailleurs de définir les référentiels techniques qui permettront de partager et utiliser les données de santé en toute sécurité. Ils ont notamment vocation à être rassemblés dans la Politique Générale de Sécurité des Systèmes d’Information de Santé (PGSSI-S), qui fixe les normes de sécurité pour tous les acteurs de l’informatique de santé. Le Big Data peut donc apporter de réelles avancées dans le domaine de la santé, mais il implique l’utilisation de données ultra-sensibles, qui même si elles sont utilisées de manière anonyme, doivent être manipulées avec précaution. De plus qu’a été discuté le projet d’un open data des données de santé… B. Du Big data à l’open Data 1. Les risques sécuritaires augmentant avec l’inflation des données. Les risques sécuritaires augmentent avec le volume de données. Les big data sont susceptibles d’être la cible des violations accidentelles ou intentionnelles des règles de sécurité établie pour le personnel et pour les prestataires. Le Big data peuvent faire l’objet de perte d’information, d’erreurs de manipulations, de vol et d’espionnage industriel, de destruction suite à une catastrophe naturelle. 2. La nécessité d’un encadrement du Big Data Le big data génère aussi des risques liés à leur nature. Si les gros volumes de données non ou semi-structurés sont déversés dans le système d’information, sans discernement, sans politique d’exploitation claire, sans sélection, sans nettoyage et sans contrôle de leur origine et de leur qualité, c’est toute la valeur du système d’information qui risque fort de s’en trouvé affecté. « garbage in, garbage out » résument les anglo-saxons.