D'autres sources sont envisagées : registres provinciaux, registres régionaux pour une maladie
ou spécialité déterminée, accords de coopération entre institutions hospitalières, institutions
hospitalières, qui transmettent directement les données sur disquette(s), laboratoires
d'anatomopathologie, etc... Ces sources permettent notamment d'obtenir de l'information clinique
(évolution de la maladie, données sociales contextuelles) et présentent, dès lors, le plus grand
intérêt.
2. Contenu de l'information enregistrée.
Parmi les informations enregistrées, on peut distinguer deux types d'information. D'une part, des
données permettent d'identifier un cas de manière unique (l"identifiant"), en vue d'obtenir, si le
besoin s'en fait sentir, des informations complémentaires de la part de l'informateur (A). Il est, en
effet, essentiel de disposer d'un identifiant pour pouvoir rattacher les renseignements provenant
de différents informateurs à un cas déterminé. D'autre part, le registre contient les données
formant le matériel de base des analyses et notamment de la recherche épidémiologique (B).
A. En ce qui concerne l'identifiant, le réseau du Registre National du Cancer fonctionnerait de
la manière suivante. D'après les informations transmises à la Commission, les informateurs
appliqueraient un algorithme de hashing (MD-5) à différentes données d'identification (le nom, la
date de naissance et le sexe), et parviendraient à un résultat unique de 25 caractères. Les
autres données (servant de base aux analyses) seraient transmises au Registre National du
Cancer, accompagnées de cet identifiant. Les mêmes nom, date de naissance et code de sexe
livreraient toujours un résultat identique. Le risque que les données relatives à deux patients
différents aboutissent au même identifiant serait négligeable (inférieur à 1/254 ). L'application de
l'algorithme de hashing aboutirait à une perte d'information. Il deviendrait ainsi pratiquement
impossible, à partir du résultat obtenu (l'identifiant de 25 caractères), de retrouver les données
d'identification d'une personne déterminée.
Si le Registre National du Cancer souhaite obtenir de l'information complémentaire ou faire
corriger une erreur (par exemple, cancer de la prostate chez une femme), il pourrait s'adresser à
l'informateur, lequel disposerait d'une table de conversion lui permettant de retrouver la personne
concernée afin de compléter ou rectifier l'information transmise.
Face au système proposé, la Commission s'est posé la question suivante. L'application de
l'algorithme de hashing garantit l'anonymat dans un sens. Sur base de l'identifiant obtenu après
application de l'algorithme de hashing, il paraît impossible de retrouver l'identité de la personne
concernée. Mais, à l'inverse, une personne disposant de l'algorithme de hashing ne pourrait-elle
pas, en accédant au Registre National du Cancer, vérifier si une personne déterminée y est
enregistrée ou non et savoir, de cette manière, si elle souffre d'une affection cancéreuse ?
Suite aux contacts entre la Commission et les représentants du Registre National du Cancer, il a
été proposé ce qui suit :
-l'introduction d'une deuxième clé (réversible) au niveau du Registre National du Cancer, en
vue de coder les identifiants. De cette manière, un individu disposant de la première clé de
hashing et ayant accès au Registre National du Cancer, ne serait plus en mesure de
vérifier si des données concernant une personne déterminée sont enregistrées.
B. Quant à l'information qui servira de matériel de base pour les analyses, elle se composerait
d'une information médicale et d'une information non médicale. L'information médicale porterait