LE-PLUS-JOLI-COURS-DE-GENETIQUE

publicité
Plan du cours 2005-2006 de génétique
Pr F. SOUBRIER 6 H
Polymorphismes et diversité génétique
Marqueurs génétiques: le génotype Ouvrages consultables :
Strachan : génétique moléculaire
L’haplotype
humaine
Thompson : génétique
La recombinaison méïotique
Delpech et Kaplan : Biol mol et med
La liaison génétique
Etienne et Clauser
Cartographie physique et génétique Feingold et Fellous
Notions de génétique somatique : réarrangement, mutations
 Lois de Mendel-transmission autosomique dominante, récessive
autosomique, liée à l’X-pathologie mitochondriale
Polymorphisme génétique

Toute variation de séquence génomique
entraînant l’existence d’au moins 2 formes
différentes de la séquence dans la population

Types de polymorphisme
 Substitution d'un nucléotide (SNP)
 Insertion/délétion
 Polymorphisme de répétition (VNTR, CA repeat…)
Exemples de Single Nucleotide Polymorphisms : SNP
Génération de la variabilité
génétique

Mutation (substitution, addition /soustraction d'un ou
plusieurs nucléotides)
… AAGTCGAT…
… AAGCCGAT…

… ATGCCT…
… ATGCTCCT…
Recombinaison
 Crossing-over (échange de matériel génétique équilibré entre 2
portions homologues de chromosomes)
Chr paternel
CCATCGA
CCATGAC
X
Chr maternel

AACAGAC
AACACGA
Conversion : se réalise dans un segment d’ADN double-hélice où
se forme un hétéroduplex. Réalise un transfert non réciproque
d’information génétique car un allèle « convertit » l’autre. Peut résulter
de la recombinaison entre séquences alléliques,
Conversion génique : transfert non réciproque d’information
génétique entre 2 gènes ayant une homologie élevée
Diversité de séquence des gènes humains
Diversité nucléotidique p :
Nombre de différences, rapporté à la longueur de la séquence
examinée, entre 2 séquences prises au hasard dans la
population
(ex: p = 4 x 10-4, 1 différence en moyenne toutes les 2500 bp)
AGTCCTA…………..GGAAACTG…………TTTACGT….
AGTGCTA…………..GGTAACTG…………TTGACGT….
7500 bp
p = 3/7500 = 1/2500
Diversité de séquence des gènes humains
_______________________________________________________________
Nb
Nb
Pop
Codant
Syn
Non
gènes
SNPs
syn
_______________________________________________________________
Halushka (1999)
75
726
Non
codant
Européens
4.5
9.0
3.1
5.4
Africains
6.3
12.9
4.2
6.8
Cargill (1999)
106
560
Européens
5.6
9.8
3.7
4.9
Onishi (2000)
41
187
Japonais
2.4
1.2
1.2
4.3
Tiret (2001)
50
228
Européens
3.0
5.6
2.3
4.3
___________________________________________________________________________
Mutations des séquences non codantes plus fréquentes que sur
les séquences codantes
Dans séquences codantes :silencieuses plus fréquentes que
non silencieuses
Notion de marqueurs en génétique : Le génotype
•Le marqueur génétique sert à repérer ou identifier un
chromosome ou un allèle transmis
• Définissent le génotype (constitution génétique d’un individu)
qui inclut les allèles d’un seul locus où de l’ensemble des locus,
selon les cas
• Marqueurs génotypiques :
• variations identifiables et connues de la séquence du
génome
• de localisation connue
• d’informativité connue
• codominants : les 2 allèles sont détectables chez les
hétérozygotes
Marqueurs génétiques 2
• est caractérisé par des allèles correspondant à chaque
variation possible de la séquence
• degré d’hétérozygotie d’un marqueur
H=1 – (Spi2)
• Fonction du nombre et de la fréquence de chacun
des allèles
• Exemple : 3 allèles de fréquence 0,2 / 0,3 / 0,5
Hétérozygotie est de 1- (0,04+0,09 + 0,25) =
0,62
2 allèles de fréquence 0,2 / 0,8 : 1- (0,04 + 0,64)= 0,32
Un marqueur biallèlique ne pourra pas avoir une
hétérozygotie supérieure à 0,5 qui sera atteinte en cas
d’allèles de fréquence égale.
Les différentes types de marqueurs :

SNP : single nucleotide polymorphism
= substitution simple de nucleotide

VNTR = variable number of tandem repeats (nombre
variable de répétitions en tandem) regroupent les ministallites
et les microsatellites
Minisatellite : répétitions en tandem de motifs de 11 à
16 paires de base en moyenne, parfois plus longs.
: répétitives, disséminées (à l’exception
des chromosomes X et Y),
: hyperpolymorphes : hétérozygotie
élevée
Exemples de Single Nucleotide Polymorphisms : SNP
VNTR : variable number of tandem repeat
Répétitions en tandem d’unité élémentaire
Microsatellite
Mononucléotide
Dinucléotide
Tri ou tetra nucléotide
Minisatellite
12-15 nucléotide
Variation du nombre n de répétitions
Mise en évidence
- Par PCR
- Par hybridation avec sondes
Minisatellites : taille variable de la répétition
- Explorés par technique de southern
- sonde monolocus spécifique d’un VNTR donné
- sonde multilocus : séquence commune à différents
minisatellites dans le génome : image complexe
- hétérozygotie supérieure à 90 %
Minisatellites associés à certaines maladies
- Diabète : minisatellite en 5’ du gène de
l’insuline
- tr du comportement VNTR 48 bp du DRD4
Minisatellite : Hybridation avec une sonde
multilocus
Les microsatellites
- Répétition de motifs de 1 à 4 nucléotides
- Le plus fréquent et le plus utilisé : dinucléotide
(CA)/(GT) : réparti sur tout le génome, très informatif.
- méthode de génotypage : amplification et
séquençage du produit de PCR
- Hétérozygosité souvent supérieure à 70%
- permet de rechercher l’instabilité des microsatellites
dans les tumeurs : caractère acquis (somatique) dû à une
anomalie du sytème de réparation des mésappariements de
l’ADN
- Exemple BAT25, BAT26, BAT40 : mononucléotide
Séquence d’un microsatellite
Instabilité
Multiplexage
Perte d’allèles
SNP
(RFLP)
VNTR (Minisat)
Variable Number
of Tandem
Repeats
STR (Microsat)
Short Tandem
Repeats
de substitution
de répétition
de répétition
> 10 nucléotides
1 à 5 nucléotides
Biallélique
Multiallélique
Multiallélique
Informativité
+
+++
+++
Détection
Southern
PCR
(hybridation,
RFLP)
PCR
Southern
PCR
uniquement
Polymorphisme
Marqueur génétique
Empreinte Génétique
 Profil génétique très spécifique d’un individu obtenu grace à
une combinaison de marqueurs de type VNTR tres informatifs,
principalement les minisatellites, ou en associant plusieurs
microsatellites.
 Intérêt en médecine légale
 Nécessite de l’ADN en qualité et en quantité suffisante au
moins pour l’amplification par PCR.
Définition de l’haplotype
Un haplotype est constitué par plusieurs génotypes , c’est à
dire une succession d’allèles sur plusieurs marqueurs
identifiés sur le même chromosome (en cis) et dont on
connaît l’ordre
• Suppose de connaître la localisation précise de chaque
marqueur
• Suppose de connaître la phase, c’est à dire le
chromosome sur lequel se situe les allèles de chaque
génotype
La détermination de l’ordre des marqueurs sur un haplotype
se fait
• Par cartographie physique : placement des marqueurs
au sein d’un segment de chromosome dont on connaît la
séquence (depuis 2002)
• séquençage de grands fragments chevauchants et
placement des marqueurs sur le chromosome
• Par cartographie génétique en examinant ces
marqueurs dans plusieurs meïoses dans des études
familiales
Les haplotypes ne sont pas toujours conservés d’une
génération à l’autre. On peut observer dans la descendance :
- Les haplotypes parentaux
- Haplotypes recombinés dus à recombinaison méiotique
Fig. 1. Linkage of PHAII to the telomere of 12p in
K22. (A) The structure of PHAII kindred K22.
Affected, unaffected, and deceased individuals of
unknown phenotype are shown as filled, unfilled,
and shaded symbols, respectively. Genotypes at loci
from the telomeric segment of chromosome 12p are
shown in their chromosomal order with the telomere
at the top; estimated genetic distances between
adjacent loci (in cM) are shown. The boxed
haplotype cosegregates with the disease. Two
independent recombination events in affected
individuals define the location of the disease gene to
the most telomeric 2-cM segment. In addition, four
loci within this segment demonstrate hemizygosity in
affected kindred members; the inferred null alleles
are denoted as "0." Genotypes that unambiguously
demonstrate absence of transmission of an allele
from affected parent to affected offspring are
indicated by asterisks. (B) Multipoint lod score for
linkage of PHAII to 12p in K22. The map of marker
loci used in the multipoint analysis is shown at the
top of the figure, and the 1000:1 support interval for
the PHAIIC locus is indicated by the thick bar.
Exemples d’haplotypes
La méiose : triple finalité
Elle assure
- La transmission de l’information génétique d’une
génération à la suivante
- La réduction du nombre de chromosomes de 2n (diploïde)
à n (haploïde) . La reconstitution de 2n se fait lors de la
fécondation
- Elle assure le brassage de l’information génétique qui
aboutit à la diversité des individus de la même espèce
Le brassage de l’information génétique
Deux mécanismes lors de la première division méiotique
-Par le mécanisme de la ségrégation au hasard lors de
l’anaphase de la 1ère division méiotique :
- n paires de Chr homologues : 2 n = le Nombre de
combinaisons chromosomiques possibles par la répartition
au hasard des chr.
- Chez l’homme n=23 donc 223 = 8,4 x 106 types de gamètes
différents
- Par la recombinaison génétique
- crossing-over impliquant la cassure des doubles hélices
paternelles et maternelles sur des points homologues
Les recombinaisons méiotiques
-Ont lieu lors de la prophase de la première division
méiotique, au stade pachytène.
- Chaque paire de chr homologue est appariée
- Chaque chr est dupliqué et formé de 2 chromatides
sœurs (chaque chromatide est formée d’une double hélice)
- Constituent une tétrade
- Recombinaison génétique : les 4 chromatides
peuvent être impliquées dans les échanges
- Au stade diplotène, les chromatides non sœurs sont
reliés par les chiasmas traduisant sur le plan
cytogénétique le crossing-over
La recombinaison homologue – mécanismes généraux 1
Recombinaison générale : entre 2 régions homologues mais pas
identiques
-Soit lors d’une cassure accidentielle de l’ADN
-Soit lors de la Méiose
Modèle de Holliday : cassure simple-brin symétrique
Pas forcément le bon modèle mais distingue les étapes :
- Molécules de DNA appariées
- Formations de brèche sur la séquence d’ADN
- Invasion du brin
- Ligation et migration de la jointure recombinante
- Résolution : recombinaison ou non recombinaison
Liaison Génétique 1
Si 2 marqueurs sur 2 chromosomes différents : transmission
indépendante des allèles
Si 2 marqueurs proches sur le même chromosome  allèles
tendent à être transmis ensemble et non de façon indépendante :
liaison génétique
Conséquences : les allèles de marqueurs situés sur des loci
génétiquement liés auront tendance à être transmis dans la même
combinaison que chez les parents : conservation des haplotypes
parentaux
Méiose
réassortis
Liaison Génétique 2
 Les échanges dus au crossing-over sont strictement
réciproques
 La fréquence de recombinaison dépend de la localisation
relative des deux gènes sur le chromosome : plus l’intervalle qui
sépare les 2 gènes est grand, plus grande est la probabilité pour
qu’un crossing-over s’effectue dans cet intervalle.
 La fréquence de recombinaison q est une mesure de la
distance génétique entre les 2 gènes
 L’unité génétique est le centimorgan cM
Liaison Génétique 3
Additivité des distances
Soit 3 gènes liés A, B, C. Par croisement on observe le
bombre de recombinants entre les 3 gènes. On obtient les
distances entre chaque couple de gènes : distance additive
La fréquence des remaniements sur l’intervalle total est
égale à la somme des fréquences des remaniements sur les deux
intervalles adjacents définis par les locus des 3 gènes
 1 seul ordre possible
Limitation de l’additivité : les doubles crossing-over
Sous-estimation des distances car plusieurs crossing-over
intéressent la même chromatide, d’autant plus grande que la
distance est grande
La répulsion : 1 chiasma (crossing-over) éloigne la
survenue du suivant
Recombinaisons haplotypiques
Crossing-over et double crossing-over
Notions de distance physique et de distance
génétique II
Distance Génétique déduite des recombinaisons observées
entre 2 marqueurs polymorphes : exprimée en Morgan
En supposant que dans un intervalle donné les
recombinaisons sont indépendantes les unes des autres , il
existe une relation entre fréquence de recombinaison
distance génétique d, exprimée en cM :
q et
1 cM ~1MB
Il est possible d’ordonner des locus expérimentalement par
l’observation des haplotypes recombinants, car les
combinaisons issues de 2 évènements de recombinaison
sont plus rares que celles provenant d’un seul évènement
Taille du génome humain en distance génétique
 Chiasmas lors de la méiose chez le sujet masculin : 49 en
moyenne aboutissant à 50% de recombinants
Longueur génétique totale : 2450 cM (plutot 2644cM)
 Méioses femelles : plus de chiasmas : taille 4481 cM
 En moyenne
- 1 cM équivaut à 1,13 Mb chez l’homme et 0,67 Mb chez
la femme. Les 2 sexes confondus : 1cM=0,9 Mb.
Fréquence des recombinaisons entre 2 locus
fonction de la distance qui les sépare
ab
ab
AB
AB
AB
ab
ab
ab
AB
ab
ab
ab
Ab
ab
ab
aB
Les 2 locus sont liés
10+8
77+88+10+8
X100 ~9% distance génétique =9cM
Notions de distance physique et de distance
génétique I
Distance physique mesurée par les méthodes physiques de
mesure de taille de fragments d’ADN clonés dans des
vecteurs :
• Méthodes d’analyse : Electrophorèse, southern, champ
pulsé pour les fragments supérieurs à 50 kb
• Fragments clonés: hybrides d’irradiation, YAC, BAC,
plasmides :
• Notion de contig : chevauchement de fragments clonés,
première étape pour le séquençage d’un génome
Principe des contigs et des STS ancrés
Conséquences génomiques de la recombinaison
méiotique
-Le brassage génétique : modification des assortiments d’allèles
en cis
- La recombinaison entre allèles peut se traduire par leur
modification par conversion génique au sein d’un hétéroduplex
- L’augmentation du nombre de copies de gènes répétés lors
d’une recombinaison inégale
- L’élimination d’un gène défectueux dans les familles de gènes
répétés.
- Evènements rares et pathologiques : lésions de l’ADN dues à
la recombinaison : délétions, insertions, remaniements
chromosomiques (changement dans la régulation, ou dans la
structure)
Applications des outils de la génétique moléculaire I
Analyse de liaison génétique :
But : mettre en évidence une liaison génétique entre un
marqueur génétique (de localisation connue) et le locus de la
maladie (inconnu)
Type d’études : familiales
Marqueur : très informatif : microsatellite
Type d’analyse : analyse paramétrique avec modèle de la
maladie
Liaison testée par méthode de vraisemblance : Lodscore : logarithme ratio vraisemblance hypothèse de liaison
sur non liaison.
Principes de la recherche d’une liaison génétique entre un
locus morbide autosomique dominant et 2 locus définis par
un SNP
Applications des outils de la génétique moléculaire II
Etudes d’association génétique
Comparaison de fréquence allélique pour un marqueur entre
un groupe témoin et un groupe de cas
Non paramétrique (pas de modèle) : tests statistiques : chi2.
On teste le déséquilibre de liaison entre marqueur (connu) et
allèle de susceptibilité (inconnu mais très proche)
Peu puissant
Nécessite de grands échantillons
Marqueurs utilisés : SNP
Etudes d’association : comparaison de 2 groupes
1 groupe témoin et 1 groupe patients atteints
Génétique somatique
Concerne les évènements génétiques postérieurs à la formation
du zygote, donc restreints à une sous-population cellulaire de
l’organisme
Exemples :
 Modification artificielle du génome cellulaire par fusion : hybride
somatique (outil de laboratoire)
 Réarrangement des gènes des immunoglobulines
 Mutation somatique : perte d’allèle, inactivation ou activation
de gènes
Réarrangement des gènes des immunoglobulines
 Système génétique devant permettre la synthèse d’au moins
plusieurs millions de molécules différentes qui forment les
immunoglobulines
 Partie constante (invariable), et une partie variable qui
reconnaît l’antigène (épitope ou motif de l’antigène)
 Ig : parties constantes différentes et variables identiques :
switch des IgM aux IgG
 Mémoire pour la réactivation de la synthèse
d’immunoglobulines
 Un seul type d’anticorps par cellule : exclusion allèlique malgré
2 chromosomes
Le modèle des chaînes légères kappa
 Gènes sur le chromosome 2
 Nécessitent 1/Gène V (variable=300), 2/gène J
(jonction=5), 3/ gène C (constant=1)
 Séquence leader devant chaque gène V codant pour le
peptide signal permettant la secrétion
 La formation d’un gène kappa fonctionnel pendant la
maturation du lymphocyte pre-B résulte d’une
recombinaison entre l’extrêmité 3’ d’un gène V et un gène J:
disparition de quelques centaines de Kb : réarrangement.
 Persistance d’un intron de 2 à 3 kb : épissé lors de la
maturation du mRNA
 La recombinaison s’effectue grâce au complexe
heptamère-nonamère par RAG-1 et RGA-2
Structure d’une immunoglobuline :
chaîne lourde et légère
Réarrangement
somatique des gènes de
chaîne légère
d’immunoglobuline
Pathologie de l’ADN 1
MACROLESIONS
Les recombinaisons entraînent Délétion ou Duplication de
grande taille (100 bp à qq millions de bp)
- Lors d’une recombinaison homologue
crossing-over méiotique inégal
- ou à un échange entre 2 chromatides sœurs
Favorisée par la présence de séquences répétées
- ou lors d’une recombinaison non homologue
Translocations entraînent des fusions en orientation directe
ou inversée (cassure et déplacement d’un Chr vers un autre
Chr)
Conversion génique : correction d’un brin de DNA par son
partenaire dans un hétéroduplex non parfaitement
complémentaire. Entre séquences alléliques ou consécutives
Mismatch sur
l’hétéroduplex
Conversion génique par correction d’hétéroduplex
Recombinaison inégale
Contiguité de gènes très semblables : recombinaison
inégale ou conversion génique
Pathologie de l’ADN 2
LESIONS A L’ECHELLE NUCLEOTIDIQUE
Petites délétions : 1 à 10 paires de base
- dépurination
- dérapage réplicatif : polymorphisme des
microsatellites
 Substitutions
- Désamination d’une cytosine méthylée
: Cytosine en Uracile
- Erreur de réplication ou de réparation
DIFFERENTS TYPES DE MUTATIONS
. PONCTUELLES:
- mutations silencieuses
- mutations conservatrices
- mutations faux sens
A
Transition
C
T
Transversion
G
. AVEC DECALAGE DU CADRE DE LECTURE
insertion ou délétion
AUG GCC UCU AAC CAU GGC
Met Ala
Ser Asn
His
Gly
. INSTABLES
AUG CUC UAA
Met Leu STOP
Pathologie de l’ADN 3
Lésions intermédiaires
 Délétion exonique : taille variable QQ dizaines à QQ centaines
de paires de base
 Expansions de triplets riches en GC : mutations
dynamiques
 mécanisme à l’origine de nombreuses maladies
génétique
- X fragile, maladie de Steinert, Huntington,
- Expansion à partir d’une taille limite
Maladies liées à l’expansion d’une répétition de
trinucléotides
Atrophie musculaire spinobulbaire (maladie de kennedy)
Synrome de l ’X fragile (FRAXA et FRAXE)
Dystrophie myotonique (maladie de Steinert)
Chorée de Huntington
Ataxie spinocerebelleuse de type I
Atrophie dentatorubrale et pallidoluysienne
Dystrophie myotonique de Steinert
 Myopathie héréditaire de l ’adulte la plus fréquente : 1/8000
 Signes musculaires, signes cardiaques, cataracte, calvitie
 Expressivité variable + phénomène d’anticipation
(aggravation de génération en génération)
 Forme adulte et forme congénitale : hypotonie néonatale
 98% des cas : Due à expansion de triplets (CTG)n dans
région 3 ’ non traduite de DM protéine kinase
 Taille normale : 5 à 35 CTG
 50 à 100 : signes minimes
 formes congénitales : > 500 répétitions
 Autre gène : locus ZNF9 : expansion CCTG
Maladie de Steinert de type 1:
Expansion de CTG (de 38 à >100) dans région 3 ’ non
traduite du dernier exon
 Perturbation de l ’expression de DMWD et de SIX 5
(chromatine) : arrythmies et cataractes
 Toxicité de RNA DMPK : Dystrophie Myotonique (liaison
RNA-BP)
 Perturbation du processing du messager DMPK
Conséquences des mutations sur le fonctionnement
du gène
- Délétion plus ou moins complète du gène
- Expression et régulation du gène
- Epissage du gène
- Altération de la phase de lecture : troncature par codon stop
prématuré
- Codon stop, mutation du codon stop, codon initiateur
- Codon faux-sens : interaction, adressage, fonction catalytique,
modification post-traductionnelle
Grands types d’anomalies fonctionnelles des
gènes
Gain de fonction
Perte de fonction
Dominant
Dominant
 Gène surnuméraire
 Haplo-insuffisance
 Gène toxique
 Dominant négatif
 Gène activé (oncogène,
récepteur)
Récessif
Perte de fonction
Maladies liées à l’expansion d’une répétition de
trinucléotides
Atrophie musculaire spinobulbaire (maladie de kennedy)
Synrome de l ’X fragile (FRAXA et FRAXE)
Dystrophie myotonique (maladie de Steinert)
Chorée de Huntington
Ataxie spinocerebelleuse de type I
Atrophie dentatorubrale et pallidoluysienne
Dystrophie myotonique de Steinert
 Myopathie héréditaire de l ’adulte la plus fréquente : 1/8000
 Signes musculaires, signes cardiaques, cataracte, calvitie
 Expressivité variable + phénomène d’anticipation
(aggravation de génération en génération)
 Forme adulte et forme congénitale : hypotonie néonatale
 98% des cas : Due à expansion de triplets (CTG)n dans
région 3 ’ non traduite de DM protéine kinase
 Taille normale : 5 à 35 CTG
 50 à 100 : signes minimes
 formes congénitales : > 500 répétitions
 Autre gène : locus ZNF9 : expansion CCTG
Minisatellite avec sonde P1 et coupure par enzyme de
restriction et southern blot. Exemples de tumeurs traitées
ou non par l’acide ocaidique.
RECHERCHE DE MUTATIONS
Gène
Régions
flanquantes 5'
ATG
-100
-70
-30 1
Régions
flanquantes 3'
STOP
AATAAA
polyadénylation
Protéine allongée
Faux-sens, Non sens, Isosémantique,
Délétion, Insertion
Epissage: absence, sites 5' ou 3' alternatifs
Anomalie de l'initiation de la traduction
Modification quantitative de l'expression
Téléchargement