4
individusdes’exprimer,departagerleursinformationsavecleursproches,etc.Etlescomportements
sontambivalents:mélangedefascinationdevantlatechnologie,depassivitéparrapportausoucide
«privacy»,enmêmetempsmontéedespréoccupations…maispasdesprécautions2!Dernierdéfi
enfin,celuidelasécurité,tantvis‐à‐visdestiersquedespuissancesétrangères:ilnesepassepasde
semainesansqu’onapprenneunenouvellefailledesécurité.
Lesimpactsdecesévolutionsentermesdeprotectiondesindividussontinquiétants:pourrésumer,
lesrisquessontaccrus,lesdroitssontpeuexercés,etlesobligationssontmalrespectées.
PouranalyserlerapportentrelesBigDataetlaprotectiondesdonnées,ilfautd’abordrappelerles
définitionsdesdonnéespersonnellesetdesdonnéessensibles.Selonlaloifrançaise,«constitueune
donnéeàcaractèrepersonneltouteinformationrelativeàunepersonnephysiqueidentifiéeouqui
peutêtreidentifiée,directementouindirectement,parréférenceàunnumérod’identificationouàun
ouplusieursélémentsquiluisontpropres.Pourdéterminersiunepersonneestidentifiable,ilconvient
deconsidérerl’ensembledesmoyensenvuedepermettresonidentificationdontdisposeouauxquels
peutavoiraccèsleresponsabledutraitementoutoutautrepersonne»(article2).Cettedéfinitionest
interprétéedefaçonlargeparlaCNIL,aucasparcasselonlanaturedesdonnées,l’importance
relativedel’échantillondepopulationconcernée,etc.Celapeutprovoquerdesincompréhensions
aveclesacteursdel’OpenDataetduBigDataquionttendanceàcroirequ’unedonnéeoùnefigure
pluslenomniaucunnuméroidentifiantn’estplusunedonnéepersonnelle.LaCNILfournitdes
conseilspouruneréelleanonymisation,etpoursuitavecl’INRIAdesrecherchessurcethème(de
mêmequesonhomologueauRoyaume‐Unilefaitavecdiverspartenairespublics).Laloidéfinitaussi
lesdonnéessensibles:«ilestinterditdecollecteroudetraiterdesdonnéesàcaractèrepersonnelqui
fontapparaitredirectementouindirectementlesoriginesracialesouethniqueslesopinionspolitiques,
philosophiquesoureligieusesoul’appartenancesyndicaledespersonnesouquisontrelativesàla
santéouàlaviesexuelledecelles‐ci»(article8;ilexistedesdérogations).
LesBigDataobligentàréexaminercesconcepts.Ils’agitdestockageetd’analyseencontinudetout
typededonnées:structuréesounonstructurées,textes,photos,vidéos,etc…Lafrontièreentre
cellesdecesdonnéesquineposentpasdeproblèmeetcellesquisontpotentiellementpersonnelles
et/ousensiblesesttrèsdifficileàtracer:onpeutpenserquebeaucoupdecesdonnéessont
potentiellementpersonnellesparrecoupement.Etquepenserdesdonnéesprédictivesde
comportements?Cesontsansdoutedenouvellesdonnéessensibles,pourlesquellesunnouveau
modederégulationpourraitêtreenvisagé.
IlfautdoncsoumettrelesBigDataàl’épreuvedelagrilled’analysedelaprotectiondesdonnées,qui
comportecinqcritères:
‐Finalité,proportionnalité
‐Pertinencedesdonnéestraitées
‐Conservationlimitéedesdonnées
2Parexemple,65%desutilisateursde«smartphones»déclarentêtrepréoccupésdelaconfidentialitédeleursdonnées,
mais30%n’ontpasdecodedeverrouillage