Utilisation des SNP pour l`identification humaine

Téléchargement

TECHNOLOGIE APPLIQUÉE

24 SPECTRA ANALYSE n° 249 • Avril - mai 2006

Utilisation des SNP pour

l’identiﬁ cation humaine

Christine KEYSER, Elizabet PETKOVSKI*

*Institut de Médecine Légale - 11, rue Humann - 67085 Strasbourg cedex - Tél : 03 90 24 33 65 – Fax : 03 90 24 33 62

Génétique

I - Introduction

Les SNP (pour Single Nucleotide Polymorphisms)

constituent les polymorphismes les plus répan-

dus du génome humain. Il s’agit de variations de

la séquence d’ADN portant sur un seul nucléotide

(ﬁ gure 1). Ces marqueurs sont répartis sur l’en-

semble du génome, toutes les 500 paires de bases

en moyenne, aussi bien au niveau des régions co-

dantes (gènes) que des régions non codantes. Ils

sont le plus souvent phénotypiquement neutres

c’est à dire qu’ils ne modiﬁ ent pas le phénotype de

celui qui les porte. A l’heure actuelle, plus de 5 mil-

lions de SNP ont été caractérisés. Cette abondance

explique l’énorme intérêt qu’ils suscitent dans les

domaines de la médecine et de la pharmacogéné-

tique où ils sont notamment utilisés pour détecter

des prédispositions individuelles à certaines ma-

ladies ou pour identiﬁ er les gènes impliqués dans

des maladies multifactorielles.

RÉSUMÉ

Les polymorphismes d’un seul nucléotide ou SNP (Single Nucleotide Polymorphisms) suscitent depuis

peu un engouement grandissant dans le domaine de l’identiﬁ cation génétique humaine. Ces marqueurs

se révèlent intéressants pour l’analyse de prélèvements biologiques dégradés, mais également dans les

tests de paternité. Outre leur utilisation à des ﬁ ns médico-légales, les SNP constituent également des

marqueurs de choix en anthropologie moléculaire pour distinguer diﬀ érents groupes (ou haplogroupes)

au niveau des lignées paternelles et maternelles et estimer ainsi l’origine ethnique des individus étudiés.

Les méthodologies de typage des SNP étant en continuel développement, le choix d’une technique

ad hoc peut paraître diﬃ cile. Notre équipe, impliquée dans des investigations génétiques, a fait celui

d’une discrimination allélique par extension d’amorces (formation de produits ayant une masse spéciﬁ que

pour chaque allèle) suivi d’une détection par spectrométrie de masse MALDI-TOF. L’objectif de cet article

est d’argumenter ce choix mais également de développer l’approche méthodologique utilisée, ainsi que

les avantages et les inconvénients de cette technique.

MOTS-CLÉS

SNP, spectrométrie de masse, PCR, identiﬁ cation génétique, contrôle de ﬁ liation

Use of SNP in human identiﬁ cation

SUMMARY

Single Nucleotide Polymorphisms or SNPs arouse a growing interest in the ﬁ eld of human genetic identiﬁ cation.

These markers are interesting for the analysis of degraded biological samples, as well as for paternity testing.

Beside their use in forensic science, SNPs are also of great interest in molecular anthropology. They distinguish

groups (called haplogroups) of paternal and maternal lineage and allow the estimation of the studied individuals’

ethnic afﬁ liation.

The SNP typing methodologies being in continual development, the choice of an appropriate technology

seems difﬁ cult. Working in the ﬁ elds of forensic identiﬁ cation we chose a method based on MALDI-TOF mass

spectrometry detection of allele speciﬁ c primer extension products. The aim of this paper is to explain this choice

as well as the used methodological approach and to discuss advantages and limits of this technique.

KEYWORDS

SNP, mass spectrometry, PCR, forensic genetic, paternity testing

Technologie appliquée

SPECTRA ANALYSE n° 249 • Avril - mai 2006

Utilisation des SNP pour l’identiﬁ cation humaine

II – SNP et identiﬁ cation génétique,

atouts et diﬃ cultés

Dans le domaine de l’identiﬁ cation génétique,

l’engouement pour les SNP ne cesse de croître car

ceux-ci possèdent plusieurs caractéristiques inté-

ressantes pour des applications médico-légales :

1) Les régions d’ADN ciblées pour l’analyse de

SNP sont de petites tailles, ce qui permet l’étude

de molécules d’acides nucléiques fragmentées.

Ceci est particulièrement important en crimina-

listique, domaine dans lequel les preuves biologi-

ques laissées sur les scènes de crimes sont souvent

présentes à l’état de traces et/ou sont dégradées

par des facteurs environnementaux tels que la lu-

mière, la chaleur ou l’humidité. Avec les techni-

ques classiquement utilisées dans les laboratoires

d’identiﬁ cation génétique, l’ADN extrait de ces

traces peut ne fournir qu’une empreinte (ou proﬁ l)

génétique partielle, diﬃ cilement exploitable ; il en

est de même pour les catastrophes de masses (e.g.

attentat du World Trade Center, Tsunami du Sud

Est Asiatique…) où les restes humains à identiﬁ er

sont souvent fortement altérés.

2) Les SNP sont considérés comme des marqueurs

génétiques stables : ils présentent un taux de mu-

tation bien inférieur à celui des microsatellites ou

STR (Short Tandem Repeats), marqueurs actuelle-

ment utilisés pour établir le proﬁ l génétique d’un

individu. Ce taux moindre de mutations (de l’ordre

de 10-8 contre 10-3) peut constituer un réel avan-

tage dans les tests de parenté où des mutations qui

surviennent sur quelques générations peuvent être

sources de confusions.

3) A la diﬀ érence des STR, l’analyse des SNP n’est

pas fondée sur l’étude du polymorphisme de lon-

gueur de régions de répétitions ce qui la préserve

d’artéfacts liés à des problèmes de « bégaiement »

rencontrés par l’ADN polymérase, l’enzyme impli-

qué dans le processus d’ampliﬁ cation de l’ADN.

4) Les SNP peuvent être étudiés par des techni-

ques d’analyse à haut-débit, ce qui facilite la cons-

titution rapide de base de données intéressant un

très grand nombre d’individus (d’où une grande

ﬁ abilité dans le calcul des fréquences alléliques par

exemple).

5) Lorsque étudiés au niveau du chromosome Y ou

de l’ADN mitochondrial, les SNP permettent d’es-

timer l’origine ethnique de l’individu à la source du

prélèvement ou de l’échantillon étudié.

Toutefois, ces marqueurs présentent également

des inconvénients qui complexiﬁ ent leur utilisa-

tion à des ﬁ ns judiciaires :

1) Pour chaque SNP, il y a logiquement 4 allèles

(ou variants nucléotidiques) possibles, mais le plus

souvent seuls 2 des ces 4 allèles existent réelle-

ment. Leur polymorphisme limité constitue donc

le principal défaut des SNP ; par exemple si l’on ap-

pelle A et B les deux allèles possibles à un site poly-

morphe donné, les individus peuvent être de type

AA, AB ou BB. Ces 3 types ou génotypes peuvent

paraître faibles en comparaison des 20 à 50 géno-

types possibles avec la plupart des STR. Ce poly-

morphisme réduit peut néanmoins être compensé

par l’analyse de nombreux SNP. Il a été démontré

que l’analyse combinée d’une cinquantaine de SNP

doit permettre d’atteindre un pouvoir informatif

équivalent à celui obtenu à l’heure actuelle grâce

aux STR (1).

2) Du fait de la nature biallélique de la majorité des

SNP, il est diﬃ cile de détecter la présence de deux

ou plusieurs ADN dans un échantillon ; l’analyse

de mélanges d’ADN est donc diﬃ cile, or ces der-

niers sont très nombreux dans les aﬀ aires crimi-

nelles (e.g. viol : mélange de cellules de l’agresseur

et de la victime ; trace de contact : mélange de plu-

sieurs individus…).

Au cours des dernières années un grand nombre

de techniques de typage des SNP ont été dévelop-

pées, chacune possédant ses propres caractéristi-

ques (pour des revues voir : 2 et 3). Certaines per-

mettent l’analyse d’un petit nombre de marqueurs

sur un grand nombre d’échantillons, d’autres auto-

risent l’analyse d’un grand nombre de marqueurs

sur un petit nombre d’échantillons, un dernier en-

semble s’applique à l’analyse d’un grand nombre de

SNP sur un grand nombre d’échantillons. L’expert

judiciaire travaillant le plus souvent à partir d’un

nombre restreint de prélèvements, l’étude d’un

nombre élevé de marqueurs avec un débit d’ana-

lyse moyen est suﬃ sante (excepté dans le cadre de

la constitution de bases de données ou de catastro-

phe de masse).

Autre facteur important à considérer : la quantité

d’ADN nécessaire pour établir un génotype. Cer-

taines techniques s’appliquent directement sur

l’ADN génomique, sans réaction d’ampliﬁ cation

préalable, ce qui nécessite une quantité minimum

d’ADN matrice relativement importante. Compte

tenu des faibles quantités d’ADN extraites à par-

tir d’un nombre non négligeable de prélèvements

médico-légaux, le choix d’une technique faisant

intervenir une étape préalable d’ampliﬁ cation par

PCR (Polymerase Chain Reaction) est indispensa-

ble. La possibilité de développer des réactions PCR

multiplexes (permettant l’ampliﬁ cation simulta-

née de plusieurs sites polymorphes) est également

primordiale, non seulement pour des questions de

quantité d’ADN mais également pour augmenter

le pouvoir discriminant de l’analyse.

Figure 1

Les SNP sont des

substitutions,

insertions ou

délétions de

nucléotides qui

surviennent à des

positions uniques

dans le génome.

TECHNOLOGIE APPLIQUÉE

26 SPECTRA ANALYSE n° 249 • Avril - mai 2006

Autre considération importante dans le contexte

médico-légal : l’analyse de mélanges d’ADN. La

possibilité de quantiﬁ er chaque allèle dans un

échantillon peut aider à l’analyse de ces mélanges.

Enﬁ n, derniers impératifs : la sensibilité, la repro-

ductibilité, et la précision de la technique doivent

être élevées tandis que la durée ainsi que le coût de

l’analyse doivent être au plus bas.

III - Méthodes d’analyse des SNP

Les méthodes de typage des SNP font intervenir

deux étapes : une étape de discrimination allé-

lique, correspondant à la formation de produits

réactionnels spéciﬁ ques à chaque allèle, suivie

d’une étape de détection des produits issus de la

discrimination allélique.

La plupart des techniques de discrimination allé-

lique comprennent une étape de pré-ampliﬁ cation

par PCR de la région contenant le SNP. Une analy-

se post-PCR est ensuite eﬀ ectuée pour déterminer

le variant allélique au site polymorphe considéré.

Les analyses post-PCR sont fondées soit sur l’hy-

bridation d’une sonde sur le produit ampliﬁ é, soit

sur une ligation des amorces, soit sur un clivage

de sonde, soit encore sur une extension des amor-

ces. Il existe également diﬀ érents systèmes de dé-

tection des produits de la discrimination allélique

parmi lesquels les puces à ADN, l’électrophorèse,

la PCR en temps réel, le pyroséquençage, la spec-

trométrie de masse. Au vu des impératifs exigés

par des analyses à visée judiciaire, la combinaison

technologique employée à l’Institut de Médecine

Légale de Strasbourg correspond à une extension

d’amorce, qui répond aux besoins qualitatifs d’une

analyse d’identiﬁ cation génétique, suivie d’une

analyse pas spectrométrie de masse MALDI-TOF

(Matrix Assisted Laser Desorption/Ionisation

Time-Of-Flight) qui répond notamment aux critè-

res de sensibilité, précision et rapidité.

1. Discrimination allélique

par extension d’amorce

Cette étape, également appelée miniséquençage,

est précédée par une étape d’ampliﬁ cation de la ré-

gion d’ADN contenant le SNP d’intérêt au moyen

d’un couple d’amorces. Les produits PCR obtenus

sont puriﬁ és au moyen de billes magnétiques puis

soumis à la réaction d’extension d’amorce ou PEX

(pour Primer EXtension). Cette réaction repose

sur l’extension d’une amorce de 1 ou 2 nucléotides,

en fonction de la séquence du fragment d’ADN ci-

ble. Cette extension se fait grâce à une ADN poly-

mérase qui incorpore de manière indiﬀ érente les

désoxyNucléotides TriPhosphates (dNTPs) et les

didéoxyNucléotide TriPhosphate (ddNTPs, voir

Note 1). Dans l’exemple de la Figure 2, une amorce

a été conçue pour se ﬁ xer à l’extrémité 3’ du SNP

d’intérêt, un polymorphisme de type T/A. L’un des

quatre dNTP du milieu réactionnel (le dATP) est

remplacé par un ddNTP (le ddATP) qui bloque la

réaction d’élongation lorsqu’elle rencontre un T.

Figure 2

Principe de la réaction

d’extension d’amorce.

L’utilisation combinée de

ddNTP avec des dNTP

permet d’augmenter

les diﬀ érences de masse

entre les allèles d’un SNP.

NOTE 1

Les ddNTP

bloquent la

synthèse de

l’ADN par les

ADN polymé-

rases après

leur incor-

poration. Ce

blocage est dû

à l’impossibi-

lité qu’ont ces

nucléotides

de former une

liaison phos-

phodiester

avec un autre

nucléotide

en raison de

l’absence du

groupement

hydroxyle sur

le carbone 3’.

Technologie appliquée

SPECTRA ANALYSE n° 249 • Avril - mai 2006

Utilisation des SNP pour l’identiﬁ cation humaine

Dans le cas du premier allèle, le ddATP est incor-

poré immédiatement, ce qui génère un amplicon

de 24 nucléotides. Dans le cas du second allèle, le

premier nucléotide (dTTP) est incorporé et l’ex-

tension se poursuit jusqu’au T ou un ddATP est in-

corporé, conduisant à l’obtention d’un produit de

25 nucléotides. Ces deux produits d’ampliﬁ cation

ou amplicons présentent des masses diﬀ érentes et

peuvent, après une étape de puriﬁ cation, être dis-

tingués notamment par leur masse.

2. Détection allélique par spectrométrie

de masse MALDI-TOF

La spectrométrie de masse (SM) est devenue une

technique de choix pour l’étude des biopolymères,

notamment depuis le développement de nouvelles

méthodes d’ionisation, qui permettent aujourd’hui

de vaporiser des molécules aussi grosses que des

protéines ou des acides nucléiques. L’une de ces

méthodes est la technique d’ionisation par dé-

sorption laser assistée par matrice ou MALDI,

méthode d’ionisation couramment associée à un

analyseur en temps de vol (TOF).

La technique MALDI utilise un faisceau laser pour

désorber et ioniser un mélange matrice/échan-

tillon co-cristallisé sur une plaque métallique. L’ir-

radiation laser provoque l’ionisation des molécules

d’échantillon et de matrice en phase gazeuse. La

matrice (un mélange d’acide 3-hydroxypicolinique

et de citrate hydrogenodiammonium) permet de

minimiser la dégradation de l’échantillon (pro-

duits de la réaction PEX) provoquée par l’absorp-

tion de l’énergie du faisceau laser incident. Une

fois les ions formés, ils sont accélérés par applica-

tion d’un champ électrostatique et envoyés dans

un tube sous vide dans lequel ils sont séparés en

fonction de leur vitesse ou temps de vol. Les ions

ayant une masse élevée volent plus lentement que

les ions ayant une masse plus faible. Leur arrivée

au bout du tube est détectée par un multiplicateur

et visualisée sous forme d’un spectre (ﬁ gure 3). Le

Figure 3

Les produits de l’extension d’amorce, mélangés à une matrice, sont co-cristallisés sur une plaque métallique. Le mélange

ADN/matrice est frappé par le faisceau d’un laser. Cette énergie est transférée à la matrice qui est vaporisée ce qui permet

à une petite partie de l’ADN d’être expulsée dans un analyseur en temps de vol. Le produit ADN chargé est ensuite accéléré

avant de pénétrer dans le tube de vol libre de champ où il va voler vers le détecteur. Les molécules chargées volent d’autant

plus vite qu’elles sont plus légères. Le temps écoulé, entre l’entrée dans le tube de vol et la collision avec le détecteur, constitue

le temps de vol (Time Of Flight).

TECHNOLOGIE APPLIQUÉE

28 SPECTRA ANALYSE n° 249 • Avril - mai 2006

temps de vol est proportionnel à la masse.

Cette technique nous a permis de sélectionner,

dans un premier temps, une quarantaine de SNP

susceptibles d’être utilisés dans le cadre d’identi-

ﬁ cations génétiques d’individus et de contrôles de

ﬁ liation (4). La Figure 4 illustre le type de résultats

obtenus dans le cadre d’une recherche en paterni-

té. Les allèles se distinguent par leur diﬀ érence de

masse, mesurée sur la base de leur temps de vol et

interprétée automatiquement par ordinateur. Cet-

te technique permet, selon l’individu étudié, de dé-

terminer s’il est homozygote ou hétérozygote pour

un SNP donné. Bien entendu, l’analyse d’un seul

SNP est insuﬃ sante et seule l’analyse simultanée

de plusieurs d’entre eux présente un intérêt pour

des investigations d’identiﬁ cations génétiques.

Des réactions PEX incluant plusieurs amorces

susceptibles de s’hybrider au niveau de diﬀ érents

SNP (réactions multiPEX) ont donc été mises en

œuvre dans un second temps. Les résultats de ces

travaux, qui intéressent une cinquantaine de SNP

devraient être prochainement publiés (5). Ils dé-

montrent clairement l’intérêt d’une approche de

typage des SNP fondée sur une discrimination al-

lélique par extension d’amorce suivie d’une détec-

tion par SM MALDI-TOF.

IV - Avantages de la SM MALDI-TOF

pour des investigations médico-

légales

L’analyse de polymorphismes ponctuels de l’ADN

par extension d’amorces et spectrométrie de

masse MALDI-TOF s’avère précise, ﬁ able, sensi-

ble, spéciﬁ que, rapide, et peu coûteuse. En eﬀ et,

contrairement à d’autres méthodes de typage des

SNP, qui identiﬁ ent les produits de la discrimina-

tion allélique en mesurant la ﬂ uorescence émise

par des molécules marquées, la spectrométrie de

masse MALDI-TOF mesure la masse moléculaire

des produits de la réaction d’extension d’amorces.

Il s’agit donc d’une méthode de détection directe

d’une propriété intrinsèque des molécules ana-

lysées : le rapport de leur masse sur leur charge.

Figure 4

Spectres obtenus dans le cadre d’une analyse de paternité. La mère est homozygote, elle possède deux allèles portant une

guanine à la position polymorphe et n’a pu transmettre qu’un allèle G à l’enfant. Ce dernier n’a pu hériter de l’allèle A que

de son père. Le père présumé étant homozygote A/A, il a pu transmettre l’allèle A et peut être le père biologique dans le cas

présent. Bien entendu, ce résultat, obtenu pour un seul locus, n’est pas signiﬁ catif et il faut tester une cinquantaine d’autres

loci pour pouvoir aﬃ rmer que le père présumé est bien le père biologique. Le pic non coloré correspond à l’amorce non

étendue utilisée dans la réaction PEX.

Mère Enfant Père présumé

1 / 6 100%

Utilisation des SNP pour l`identification humaine

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Utilisation des SNP pour l`identification humaine

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib