Modèles animaux : génétique de la souris

publicité
Modèles animaux :
génétique de la souris
Jean Jaubert
1
Plan général
Eléments de nomenclature
- Origine des souris de laboratoire
- Données Génétiques de base pour la souris
- Les types de lignées : consanguines, congéniques, consomiques,
recombinantes consanguines, recombinantes congéniques;
les colonies non consanguines
- Effet du fonds génétique
- Contrôle de qualité génétique
- La séquence et après…
2
Origine des souris
3
Origine des souris de laboratoire
Ancestral
Mus musculus
species
domesticus
castaneus
molossinus
European
fancy mouse
1M
années
musculus
East asian
fancy mouse
2000
ans
100
ans
Laboratory
strains
Wade et al. (2002), Nature, 420, 574-578
4
Phylogénie des souris
domesticus
molossinus
castaneus
M. musculus
musculus
bactrianus
M. spicilegus
M. macedonicus
M. spretus
M. caroli
M. cooki
M. cervicolor
M.A.
0
0,23
0,35
1,10
1,75
2,40
5
Miss Abbie C. Lathrop
Origine des principales lignées consanguines
d'après Mouse in Biomedical Research
Ed. by Henry L. Foster, J. David Small and James G. Fox
6
Academic Press, 1981
William E.
Castle
(1867-1962)
Clarence C.
Little
(1888-1971)
Leonell C.
Strong
7
DBA/2
SJL/J
FVB/N
129
C3H
BALB/c
ICR
C57BL/6
CAST
ftp://ftp.informatics.jax.org/pub/datasets/misc/genealogy/genealogy.pdf
8
Eléments de nomenclature
9
La nomenclature
- Elle est indispensable
- Elle doit être rigoureuse
- Elle apporte des informations
… malheureusement, les règles dépendent des espèces !
Référence (Mouse Genome Informatics ou MGI)
- http://www.informatics.jax.org/mgihome/nomen
10
Définitions
Allèle
Variant de séquence d'un gène, identifié au niveau de l'ADN
(polymorphisme) ou d'un phénotype (mutant).
Locus
Site quelconque du génome, fonctionnel ou non, qui peut être cartographié
par une analyse génétique formelle.
Gène
Une séquence d'ADN à laquelle on peut attribuer une fonction ou un
caractère.
Gènes chez
la souris
Le symbole est en italiques, le premier caractère est en majuscule, les
autres en minuscule (ex : Apc, Adenomatosis polyposis coli). Les protéines
sont écrites en majuscules et sans italiques (APC).
Gènes chez
l'homme
Le symbole est en italiques, tous les caractères sont en majuscule (ex :
APOA1). Les protéines sont en majuscules et sans italiques (APOA1).
11
Définitions
Marqueur
Moyen permettant l’identification d’un gène ou d’un locus
Haplotype
Association d’allèles (tout type de marqueurs) génétiquement liés
Variant
d’épissage
Formes d’épissage alternatives d’un gène résultant de la combinaison de
différents exons
Mutation
Allèle conférant une différence phénotype identifiable par rapport à la
référence « sauvage »
Génotype
Description de la composition génétique d’un animal (allèles particuliers à
des loci particuliers)
Phénotype
Résulte de l’interaction entre génotype et environnement, mesurable
Dominant et Comment est hérité le phénotype
récessif : les 2 allèles sont porteurs du variant ou de la mutation
récessif
Dominant : un seul variant allèlique est suffisant
Quantitativ
e Trait Loci
(QTLs)
Loci polymorphes contenant des allèles affectant de façon différente
l’expression de traits phénotypiques quantitatifs ou à distribution
continue
12
« Laboratory codes »
„
Le Laboratory Registration Code or Laboratory code
Usuellement composé de 3 à 4 lettres (1ère lettre en majuscule, ensuite
en minuscules)
„
identifie un institut, un laboratoire ou un chercheur qui a produit ou
détient de stocks d’animaux
„
Sous-lignées, congéniques, autres lignées… devraient être identifiées
par ce Lab code, pour les distinguer entre elles
„
Attribués par « Institute of Laboratory Animal Research (ILAR) »
(http://dels-old.nas.edu/ilar_n/ilarhome/register_lc.php).
„
„
Exemples de Laboratory codes :
„
„
„
„
„
„
„
„
„
J
Rl
Jr
Mcw
Kyo
Rj
Hsd
Crl
Pas
The Jackson Laboratory
W.L. and L.B. Russell
John Rapp
Medical College of Wisconsin
Kyoto University
Centre d’élevage Robert Janvier
Harlan Sprague Dawley
Charles River Laboratories
Institut Pasteur…
13
Données génétiques de base chez la souris
19 chromosomes acrocentriques + XX ou XY
Environ 1500 cM (1 cM de souris = 1,8 Mb
d’ADN)
10.000 marqueurs (6000 microsatellites) =
résolution théorique 0,1 cM
Nombreuses homologies de synténie avec
les chromosomes humains
14
Homologies de synténie homme-souris
„
„
Cela permet de faire des
prédictions sur la probable
localisation d’un gène
lorsque celle ci est connue
dans une espèce et pas dans
l’autre
Cela permet aussi de valider
certains modèles
A
a
b
B
C
?
D
E
c
e
centromère
„
Sur de courtes distances,
l’arrangement linéaire des
gènes sur les chromosomes
est le même chez l’homme et
chez la souris
d
15
Homologies interspécifiques
Souris
Homme
Chr 5
Chr 18
Chr 2
Chr 1
16
Le génome de l’homme
„
Compétition public/privé
„
Différences de méthodes: WGS vs Contig-based
„
The sequence of the human genome (CELERA)
Science. 2001 Feb 16; 291(5507): 1304-51
Initial sequencing and analysis of the human genome
(Human genome consortium)
Nature. 2001 Feb 15; 409(6822): 860-921
„
„
1ers assemblages mis en ligne en 2001: golden path
17
Le séquençage des génomes
18
Le génome de la souris
„
3 x 109 bp (comme l ’homme), environ 750 Mo
„
Certainement > 30,000 gènes mais probablement < 100,000
„
Pas plus de 5 à 8 % d’ADN code pour des protéines
„
Beaucoup de séquences répétées (2 à 105 copies par génome)
„
Chr10 souris = génome de la Drosophile
„
Initial sequencing and comparative analysis of the mouse genome.
Nature. 2002 Dec 5; 420(6915): 520-62
19
Les autres génomes
„
„
„
Genome sequence of the Brown Norway rat yields insights
into mammalian evolution
Nature. 2004 Apr 1;428(6982): 493-521
Genome sequence, comparative analysis and haplotype
structure of the domestic dog
Nature. 2005 Dec 8;438(7069): 803-19
Should the draft chimpanzee sequence be finished ?
Trends Genet. 2006 Mar;22(3): 122-5
20
La fuite en avant…
„
„
„
„
„
Séquenceurs haut-débit: 454 et Solexa
Puces hautes densités en SNPs (1M) pour génotypage
et/ou recherche de CNVs chez l’homme et chez la souris
17 autres lignées de souris en cours de séquençage
74 autres lignées de souris pour avec données de SNPage
haute densité
Projet 1000 Génomes (Humain) pour fin 2009
21
Bases de données phénotypiques souris
• Souris
• MGI: //www.informatics.jax.org
• Phenome Mouse: //phenome.jax.org/pubcgi/phenome/mpdcgi?rtn=docs/home
• Trans-NIH Knock-out mouse project: en construction
• Mouse Knockout & Mutation Database:
//research.bmn.com/mkmd
payant
• Homme
• OMIM:
//www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM
22
Bases de données marqueurs/SNPs souris
•
Whitehead/ MIT: //www.broad.mit.edu/tools/data/genvar.html
•
Genethon: //www.cephb.fr/ceph-genethon-map.html
•
NCBI: //www.ncbi.nlm.nih.gov/gquery/gquery.fcgi/
ou, …gov/SNP/MouseSNP.cgi
•
MGI: //phenome.jax.org/pub-cgi/phenome/mpdcgi?rtn=snps/door
•
Roche (SNPs): //mousesnp.roche.com/cgi-bin/msnp.pl
•
WTCHG: //zeon.well.ox.ac.uk/rmott-bin/strains.cgi
23
Bases de données séquence souris
•
NCBI: //www.ncbi.nlm.nih.gov/mapview
•
ENSEMBL: //www.ensembl.org
•
UCSC: //genome.ucsc.edu
DOE Joint Genome Institute: //www.jgi.doe.gov
(Community Sequencing Programs)
•
24
Les populations de souris de laboratoire
Lignée consanguine (inbred strain)
Lignée co-isogénique
Lignée congénique (et speed congenic)
Colonies non consanguines
Lignées recombinantes consanguines
Lignées recombinantes congéniques
25
Lignée consanguine
Lignée
DBA/2J
F175
F176
F177
26
Les quatre types de croisement
INCROSS
(OUT)CROSS
A/A x A/A
a/a x a/a
A/A x a/a
A/A
a/a
A/a
BACKCROSS
INTERCROSS
A/a x a/a
A/a x A/a
50% A/a
50% A/a
25% a/a
25% A/A
50% a/a
27
Quatre types de croisements
I) INCROSS
IV) CROSS
Descendants
A/A x A/A
a/a x a/a
A/A x a/a
Type
Génotypes
a/a
A/A
a/a
A/a
I
a/a x a/a
1
II) BACKCROSS
III) INTERCROSS
II
a/a' x a/a
0,5
A/a x a/a
A/a x A/a
50% A/a
50% a/a
50% A/a
25% a/a
25% A/A
a/a' x a'/a'
III
a/a' x a/a'
IV
a/a x a'/a'
0,25
a/a'
a'/a'
0,5
0,5
0,5
0,5
0,25
1
Fréquences des types de croisements à la génération N+1
en fonction de la génération N
Type (gén. N)
I
II
III
IV
I
1
0,25
0,125
Génération N+1
II
0,5
0,5
III
IV
0,25
0,25
1
0,125
28
Evolution des types de croisements au cours des générations
Type
Génotypes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
I
a/a x a/a
0,125
0,281
0,414
0,525
0,616
0,689
0,748
0,796
0,835
0,867
0,892
0,913
0,929
0,943
0,954
0,963
0,970
0,976
0,980
0,984
II
a/a' x a/a
0,500
0,375
0,344
0,273
0,225
0,181
0,147
0,119
0,096
0,078
0,063
0,051
0,041
0,033
0,027
0,022
0,018
0,014
0,012
0,009
III
a/a' x a/a'
0,250
0,313
0,203
0,176
0,138
0,113
0,091
0,073
0,059
0,048
0,039
0,031
0,025
0,021
0,017
0,013
0,011
0,009
0,007
0,006
IV
a/a x a'/a'
0,125
0,031
0,039
0,025
0,022
0,017
0,014
0,011
0,009
0,007
0,006
0,005
0,004
0,003
0,003
0,002
0,002
0,001
0,001
0,001
Hétéro
0,875
0,719
0,586
0,475
0,384
0,311
0,252
0,204
0,165
0,133
0,108
0,087
0,071
0,057
0,046
0,037
0,030
0,024
0,020
0,016
1,000
0,900
0,800
Fréquence
0,700
Type I
0,600
Type II
0,500
Type III
0,400
Type IV
0,300
0,200
0,100
0,000
1
2 3 4 5
6 7 8 9 10 11 12 13 14 15 16 17 18 19 2
Générations
29
Évolution du pourcentage du génome à l'état hétérozygote
au cours des générations de consanguinité
Pourcentage des locus
à l'état hétérozygote
1
0,1
0,01
0,001
0
5
10
15
20
25
Nombre de générations de consanguinité
30
Lignées consanguines : sous-lignées
F16
F17
F18
F19
31
Entretien d'une lignée consanguine
F16
F17
F18
F19
32
Propriétés des lignées consanguines
- Populations génétiquement homogènes et (assez) stables dans le temps
- Tous les individus sont identiques : un couple suffit à définir la lignée
(ex : duplication ou congélation de la lignée)
- Pas de variance phénotypique d'origine génétique : variance phénotypique
totale faible, plus grande facilité à mettre en évidence une différence
- Plusieurs centaines de lignées consanguines disponibles
- Possibilité d'étudier l'effet du sexe à génotype constant
- Possibilité d'étudier un phénotype apparaissant avec une fréquence faible
- Certaines lignées ont des propriétés biologiques très particulières
(NOD, DDK, etc…) et sont des modèles d'étude
- Croisements entre lignées consanguines : configurations génétiques simples
33
Lignées consanguines : avantages
Faible variabilité biologique : grande puissance
pour détecter des différences
Nombreuses lignées disponibles avec
caractéristiques originales
Possibilité d'identifier des gènes responsables
de différences phénotypiques
34
Lignées consanguines : limites
Fragilité, difficulté d'élevage
Sensibilité à l'influence de facteurs génétiques
(mutations) et non génétiques (environnement)
Risque de faire des observations non
représentatives ou généralisables
35
Mouse Phenome Database (1)
Red blood cell count (x109/mL)
36
Mouse Phenome Database (2)
Phospholipid protein transfer activity after 6 wks on atherogenic diet
www.jax.org/phenome
37
Eléments de nomenclature
38
Lignées consanguines
- Définition : au moins 20 générations FxS; générations de consanguinité : F50
- Symbole :
une lettre majuscule + autres lettres ou chiffres
ex : A, AKR, NZB, C3H
exception : 129
- Sous-lignées : barre oblique
+ chiffre : DBA/2
+ lettre(s) : C3H/He, FVB/N
+ les deux : C57BL/6J
39
Hybrides F1
- Définition : issus du croisement entre deux lignées consanguines
- Symbole : abréviation en majuscules des deux lignées parentales
40
Abréviations autorisées
129
129 strains (may include subtype, e.g., 129S6 for strain 129S6/SvEvTac)
A
A strains
A K
AKR strains
B
C57BL
B 6
C57BL/6 strains
B10
C57BL/10 strains
B R
C57BR/CD
C
BALB/c strains
C 3
C3H strains
C B
CBA
D 1
DBA/1 strains
D 2
DBA/2 strains
H R
HRS/J
L
C57L/J
R 3
RIIIS/J
J
SJL
SW
SWR
41
Hybrides F2
- Définition : issus du croisement entre des F1 issus de deux lignées consanguines
- Symbole : abréviation en majuscules des deux lignées parentales
42
Nomenclature quizz
„
„
„
„
BALB/cByJRj
La lignée BALB, sous-lignée /c, crée par le Dr Bayley élevée
au Jackson puis maintenue par l’elévage Janvier
ACI/N (F159)
Lignée de rat ACI, élevée au NIH avec 159 générations de
croisements frères x soeurs.
43
Lignée consanguine ségrégeant pour une mutation
récessive viable et fertile à l'état homozygote
Lignée
129/SvJ
+/bal
bal/bal
bal/bal
+/bal
+/bal
bal/bal
F?+6
F?+7
F?+8
44
Lignée consanguine ségrégeant pour une mutation
récessive létale (ou stérile)
Lignée BALB/cJ
+/rl
F?+26
+/rl
F?+27
[rl]
rl/rl
[+]
+/rl ?
[+]
+/rl ?
Au moins un [rl] dans les 10
premiers petits:
les deux parents sont +/rl
Nouveaux couples à partir des petits
normaux frères et sœurs de [rl]
[+]
+/rl ?
[+]
+/rl ?
Pas de [rl] dans les 10
premiers petits:
l'un des parents est
"probablement" +/+
Éliminer le couple
F?+28
45
Lignée co-isogénique
Lignée C57BL/6J
[+]
[+]
F65
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
[+]
+/c
[+]
+/c
[+]
+/c
+/c
[c]
c/c
+/c
F66
F67
F68
F69
F70
46
Eléments de nomenclature
Allèles chez Le symbole est en italiques et en exposant du symbole du gène. Le
premier caractère est une majuscule si la mutation est (co-)dominante
la souris
Min
(ex: Apc , multiple intestinal neoplasia). C'est une minuscule si la
mutation est récessive (ex: Leprdb, gène = leptin receptor, allèle =
diabetes).
Quand un allèle n'est reconnu que par un phénotype mutant, les symboles
du gène et de l'allèle sont identiques (db était le symbole de diabetes).
47
Mutations spontanées ou induites non ciblées
- Définition : mutations apparues spontanément ou obtenues après mutagénèse
physique (rayonnements ionisants) ou chimique aléatoire.
- Symbole : Nom de la lignée consanguine
+ symbole de l'allèle muté
48
Mutations co-isogéniques
-Définition : lignée consanguine différent pour un seul locus (en général suite à une
mutation).
- Symbole : symbole de la lignée + tiret et le symbole du gènes différent, en italique
„
„
„
„
C57BL/6JEi-tth
The tremor with tilted head mutation in the C57BL/6JEi
strain.
C57BL/6J-Aqp2cph
The congenital progressive hydronephrosis mutation in the
aquaporin 2 gene arose on the C57BL/6J strain
49
Lignée congénique
- Lignée consanguine dans laquelle on a introduit une mutation ou un
transgène par croisement
+/+
"C
on
gé
nis
a
tio
n"
Tg/+
Tg/+
50
Lignée congénique pour un locus
Backcross
Lignée FVB/N
Tg/+
+/+
Lignée C57BL/6
Identification des Tg/+
C57BL/6 +/+
F1 = N1
Identification des Tg/+
C57BL/6 +/+
N2
Identification des Tg/+
C57BL/6 +/+
N3
Répéter jusqu'à N10
Identification des Tg/+
N10
Identification des Tg/Tg
N10F1
Lignée congénique de C57BL/6
51
Lignée congénique pour un locus
Intercross
Lignée BALB/cJ
c/c
+/+
+/c
+/c
Identification des c/c
+/c
Identification des c/c
C57BL/6 +/+
+/c
C57BL/6 +/+
Lignée C57BL/6
F1 = N1
F2 = N1F1
N2
F2 = N2F1
Répéter jusqu'à N10
Identification des c/c
Identification des c/c
Lignée congénique de C57BL/6
N10F1
N10F2
52
Lignée congénique : proportions théoriques de
provenance du génome
Génération
F1
N2
N3
N4
N5
N6
N7
N8
N9
N10
% moyen
segments hét.
% génome
donneur
% génome
receveur
100
50
25
12,5
6,3
3,1
1,6
0,8
0,4
0,2
50
25
12,5
6,25
3,125
1,56
0,78
0,39
0,2
0,1
50
75
87,5
93,7
96,7
98,4
99,2
99,6
99,8
99,9
53
Lignée congénique : évolution du segment transféré
30
25
cM
20
15
10
5
0
5
10
15
20
25
30
35
40
45
50
Générations de backcross (N)
54
Lignée congénique : évolution du segment transféré
A
B
B
Tg
N2
Tg
B
Tg
Tg
N1
N3
N4
B
Tg
B
N5
B
Tg
55
Lignée congénique : sélection par marqueurs
B
F1
X
X
X
m1
m1
m2
B
m2
m1
B
m2
56
Lignée speed congénique
Wakeland et al., Immunology today, 1997, 18, 472-477
57
Lignée speed congénique
Souris
D1Mit12
D2Mit4
D4Mit7
……
D19Mit65
% B/B
1
B/B
B/B
A/B
...
A/B
53
2
B/B
A/B
B/B
...
A/B
49
3
A/B
A/B
A/B
...
B/B
41
4
A/B
B/B
B/B
…
A/B
55
5
A/B
B/B
A/B
…
B/B
62
6
B/B
B/B
A/B
…
B/B
74
….
….
….
….
….
….
….
96
B/B
A/B
A/B
…
A/B
57
97
B/B
A/B
B/B
…
B/B
43
98
A/B
A/B
B/B
…
B/B
52
99
A/B
A/B
B/B
…
A/B
48
100
B/B
B/B
A/B
…
B/B
46
% B/B
47
54
50
…
42
58
Lignée speed congénique
59
Lignée speed congénique
Nb souris
N2 (15%)
N3 (3%)
N4 (<1%)
60
30
30
50
25
50
40
20
40
30
15
30
20
10
20
10
5
10
0,3 0,5 0,7
0,05 0,15 0,25
0,01 0,03 0,05
Hétérozygotie
Intercross pour produire la lignée congénique
Voire même possibilité de lignée « Supersonique » congénique !
60
Lignée consomique ou CSS
- Lignée consanguine dans laquelle on a introduit par croisement
une paire de chromosomes d’origine différente
F1
B
A
B
Consomique A-Chr XB
61
Eléments de nomenclature
62
Lignées congéniques
- Définition : produites par >10 générations de croisement sur une lignée consanguine
- Symbole : abbréviation en majuscules des deux lignées parentales
+ symbole de l'allèle provenant de la lignée donneuse
63
Lignées consomiques
- Définition : lignée consanguine dans laquelle on a transféré par croisements répétés
un chromosome entier d’une autre lignée
- Symbole : Lignée
„
„
„
„
„
„
receveuse-Chr #Lignée Donneuse
SHR-Chr YBN
Pour cette lignée consomique de rat, le chromosome Y de BN a été transféré
par backcross répétés sur le fonds SHR.
C57BL/6J-Chr 19SPR
Pour cette lignée consomique de souris, un Chromosome 19 s’origine Mus
spretus a été backcrossé sur C57BL/6J.
C57BL/6J-Chr 1A/J Chr 3DBA/2J
Pour cette lignée consomique de souris, le Chromosome 1 de la lignée A/J et
le Chromosome 3 de la lignée DBA/2J ont été backcrossés sur C57BL/6J.
64
Les colonies non consanguines
- Produire des animaux qui ressemblent davantage aux populations
naturelles
- Entretenir une hétérogénéité génétique
- Eviter au maximum les croisements consanguins
- Objectif : < 1% d'augmentation de la consanguinité par génération
- La population est définie par des fréquences alléliques
65
Colonies non consanguines
Rotation des géniteurs
Colonie de grande taille
66
Propriétés des colonies non consanguines
- Populations génétiquement hétérogènes, plus proches des
populations naturelles
- Robustes et faciles d'entretien
- Tous les individus sont différents : il faut un très grand échantillon
d'individus pour s'approcher de la composition génétique
- L'entretien d'une colonie non consanguine doit se faire à grande échelle,
avec des règles strictes
Fréquence
- Variance phénotypique totale assez grande : moins de puissance pour
mettre en évidence une différence
Colonie non
consanguine
Lignée consanguine
Paramètre
67
Origine colonies non consanguines
ƒ La plupart des colonies non-consanguines ont une origine
commune :
- Elles dérivent d’une seule colonie Swiss d’environ
200 souris à partir de laquelle 2 mâles et 7 femelles ont été
importées au Rockefeller Institute for Medical Research in
New York
- Outbred Swiss stocks disponibles actuellement :
NMRI, CFW, MF1, CD1, ICR, NIHS, ND4 and SW.
ƒ Toutes les outbreds ne proviennent pas de Lausanne en
Suisse (Switzerland).
- Exemples de lignées Non-Swiss :
CF-1, NSA, OF1, SABRA et TO.
68
Origine colonies non consanguines
69
- Manque de puissance
ex : sommeil après hexobarbital :
- de 18 à 48 min (sd 3,2 min) chez consanguines
- 43 et 48 min (sd 13,5 min) dans 2 stocks
pour rechercher une différence de 4 min. (5%, puissance 80%) :
- 12 souris consanguines
- 180 souris non consanguines
puissance pour détecter 4 min. de différence avec 20 souris :
- 97% avec souris consanguines
- 14% avec souris non consanguines
70
Faut-il vraiment continuer d'utiliser des
souris non consanguines ?
- Composition génétique de chaque stock est mal connue, mal contrôlée
- Hétérogénéité génétique très variable d'un stock à l'autre
- Accidents de population souvent mal documentés (bottleneck,
sélection directionnelle) avec conséquences importantes
- Ségrègent parfois pour des mutations récessives délétères
- Génétiquement instables
- Et pourtant: résolution génétique plus fine (math), variabilité plus
proche de ce qu’on observe chez l’homme
71
Colonies non consanguines : avantages
Grande robustesse et prolificité, faible coût
Génétiquement hétérogènes donc plus
représentatives d'une population naturelle
72
Colonies non consanguines : limites
Résultats plus hétérogènes d'un individu à l'autre
Populations difficiles à stabiliser génétiquement
Nécessité de recourir à de groupes importants
73
Eléments de nomenclature
74
Colonies non consanguines
„
„
Pour les outbreds, la racine de la lignée est précédée par le
code ILAR de l’institution qui maintient la colonie.
Tac:ICR
„
Le stock ICR outbred maintenu par Taconic Farms, Inc.
„
Hsd:NIH Swiss
„
„
„
Le stock NIH Swiss outbred maintenu par Harlan Sprague
Dawley, Inc..
C57BL/6Tac-Bmp4tm1Blh[cc]
Une colonie fermée de souris provenant de la lignée
consanguine C57BL/6Tac et portant une mutation ciblée
(tm1Blh) sur le gène Bmp4
75
Conplastiques
„
Les lignées conplastiques sont des lignées dans lesquelles le
génome « nucléaire » d’une lignée a été introduit dans le
cytoplasme d’une autre, i.e., le donneur mitochondrial est
toujours le parent femelle lors du programme de backcross
répétés
„
NUCLEAR GENOME-mt
„
C57BL/6J-mt CAST/Ei
„
CYTOPLASMIC GENOME
Une lignée avec le génome nucléaire de C57BL/6J et le
génome cytoplasmique (mitochondrial) de CAST/Ei.
76
Les lignées recombinantes consanguines
(Recombinant inbred strains)
Lignée A
Lignée B
F1
F2
F1
....
20 générations de croisements consanguins
AXB-1
AXB-25
77
Les lignées recombinantes consanguines
25 couples F2
F1
A
…..
B
F20
…..
AXB-1
AXB-25
78
Propriétés des lignées rec. consanguines
- Populations génétiquement homogènes et stables (consanguines)
- Génotypes recombinants fixés de façon définitive
- Possibilité de les reproduire à l'infini
- Cumuler les observations faites dans plusieurs laboratoires
- Etudier l'effet du sexe à génotype recombinant constant
- Etudier des caractères quantitatifs avec répliques, des
caractères mesurés par moyenne et écart-type, par des
pourcentages, des taux de survie, etc...
79
Grisel et al., J. Neurosci., 1997, 17, 745-754
80
Les lignées recombinantes congéniques
(Recombinant congenic strains)
Lignée A
Lignée B
F1
BC1
B
Lignée B
....
B
20 générations de croisements consanguins
AcB-1
AcB-25
81
Les lignées recombinantes congéniques
25 couples BC x B
F1
BC
×
A
BC
×
B
…..
×
B
B
×
20 générations de
croisements consanguins
B
F20
…..
AcB-1
AcB-25
82
Propriétés des lignées rec. congéniques
- Tous les avantages des lignées recombinantes consanguines :
stabilité, génotypes fixés, résultats cumulables, ...
- Plus grande puissance pour l'étude des caractères multigéniques
et la recherche d'interactions épistatiques
9
8
7
6
5
4
3
2
1
0
26 lignées recombinantes
congéniques
14
12
Nombre de lignées
Nombre de lignées
Caractère
contrôlé par
5 locus
26 lignées recombinantes
consanguines
0
1
2
3
4
5
Nombre de locus différant entre
une lignée recombinante consanguine
et la lignée parentale A
10
8
6
4
2
0
0
1
2
3
4
5
Nombre de locus différant entre
une lignée recombinante congénique
et la lignée receveuse B
83
Eléments de nomenclature
84
Lignés recombinantes consang. ou cong.
„
„
„
„
„
„
CXB
Lignée recombinant consanguine produite par croisement
entre les lignées BALB/c x C57BL/6J
BXD1, BXD2, BXD3
Membres du panel de lignées RI BXD obtenues par
croisement entre C57BL/6 x DBA/2.
CcS
Lignée Recombinante congénique entre BALB/c receveuse et
STS donneur.
85
Le "Collaborative Cross"
- Produire un jeu de lignées
consanguines hybrides entre 8
lignées consanguines très
différentes
- Mélanger le génome de
différentes sous-espèces pour
obtenir un "feu d'artifice" de
phénotypes nouveaux
- Objectif : > 1000 lignées !
Actuellement : > 700 en cours
- Intérêts :
→ Créer des phénotypes très variés dans des lignées stables
→ Avoir les moyens d'identifier les gènes responsables (voies métaboliques)
→ Permettre de comparer phénotypes / expression / génotypes
86
PWD
CAST/Ei
WSB/Ei
A/J
NOD/Lt
NZO
129S1/Sv
C57BL/6
Le "Collaborative Cross"
87
Le "Collaborative Cross"
1.000 lignées indépendantes dont le génome est un réassortiment unique
88
GeneNetwork.org
Génotypes
Expression des gènes
Phénotypes
Quels gènes contrôlent
le niveau d'expression ?
Lignées
Quels gènes sont
co-exprimés ?
Quels phénotypes
sont corrélés ?
Quels gènes ont un niveau
d'expression corrélé à un phénotype ?
Quels gènes contrôlent un phénotype ?
89
GeneNetwork.org
90
Effet du fonds génétique
91
Effet du fonds génétique: exemples
diabetes (db),
obese (ob)
Multiple intestinal
neoplasia (Min)
EGF-R knock-out
C57BL/6
C57BL/Ks
obésité
diabète
(B6 x AKR)F1
C57BL/6
~ 6 polypes
~ 30 tumeurs
intestinales
CD-1
CF-1
survie à
3 semaines
mort à
l'implantation
92
Effet du fonds génétique
Modèles animaux et pathologie humaine
B
A
C
Lignée
consanguine
Fréquence
Population
humaine
Sévérité du phénotype
93
Gènes modificateurs chez la souris
Peuvent être localisés dans des croisements
- F2 ou BC à partir de lignées consanguines
Leur fonction physiologique peut être étudiée
- lignées congéniques, variants présents dans des lignées consanguines
- lignées transgéniques, KO, KI, KO conditionnels
Fournissent des candidats pour l'homme
- difficiles à identifier chez l'homme (gènes x environnement)
- homologies homme-souris : gènes, fonctions, voies métaboliques
Enjeu majeur pour les maladies monogéniques
- dépistage précoce des formes à évolution sévère
- traitements pour réduire la gravité des symptômes
94
Ferrochelatase deficiency
- Apparue après mutagénèse à l'ENU
- Backcross répétés sur BALB/c
- Anémie, ictère, hépatomégalie, splénomégalie
- Dépôts de pigment brun et de cristaux dans les cellules de
Küppfer et les voies biliaires
- Déficit partiel en ferrochelatase :
3 à 5 % d'activité résiduelle chez les homozygotes
55% d'activité résiduelle chez les hétérozygotes
95
Ferrochélatase
Me
Vi
Me
Vi
Fe2+
N
Me
NH
Pr
Me
HN
Vi
N
Pr
N
Me
Pr
N Fe2+ N
N
Ferrochélatase
Me
Protoporphyrine IX
Me
Pr
Vi
Me
Hème
- Membrane interne de la mitochondrie
- Hème : érythropoïèse, cytochromes
96
Protoporphyrie érythropoïétique (homme)
- Déficit partiel en ferrochelatase
- Photosensibilité d'apparition précoce (jeune enfant)
- Accumulation de protoporphyrines (peau, foie)
- < 5% des cas : accumulation massive de PP dans le foie,
troubles excrétoires, lésion hépatocellulaires,
insuffisance hépatique fatale
97
Physiopathologie de le PPE
PEAU
Photosensibilité
ERYTHROBLASTES
PLASMA
Cristaux,
lésions et mort
cellulaires
Protoporphyrine
Fe++
Ferrochélatase
Dégradation
Bilirubine
HEME
ANEMIE
FOIE
Conjugaison
Excrétion
biliaire
ICTERE
INSUFFISANCE
HEPATIQUE
98
Effet du fonds génétique
Non-transgéniques
f/f
50% BALB/cJ
25% SJL
25% C57BL/6J
SJL
cDNA
ferrochelatase
humaine
C57BL/6J
Hormones
+/+
+/f
+/f
BALB/cJ
Proto: ++
Ictère: -
f/f
Proto: +++
Ictère: +++
99
Lignées congéniques
BALB/cJ
f/f
SJL
C57BL/6J
f/f
f/f
100
Recherche de gènes modificateurs
Gènes
modificateurs
Quel phénotype
étudier ?
Fonctions cellulaires
SOUSPHENOTYPES
Interactions cellulaires
/ tissulaires
Fonctions biologiques
EVALUATION
CLINIQUE
Etat physiologique global
101
Lignées congéniques (3 mois)
BALB/c
C57BL/6
SJL
32
Masse corporelle (g)
30
28
26
24
22
BALB/cJ
11
GR (x109/mL)
SJL
16
Hb (g/dL)
46
12
44
11
+/+
fech/fech
10
Ht (%)
54
48
13
8
fech/fech
50
14
9
+/+
52
15
10
7
20
42
+/+
fech/fech
40
+/+
fech/fech
102
Lignées congéniques (3 mois)
BALB/c
C57BL/6
SJL
Fluorescence GR (x1000)
90
80
70
60
50
40
30
20
10
0
+/+
fech/fech
Bilirubine totale (μmol/L)
160
140
120
100
80
60
40
20
0
+/+
fech/fech
PAL (UI/L)
600
500
400
300
200
100
0
+/+
fech/fech
103
Analyse factorielle discriminante
4
SJL/J
2
Function 2
y = 0.025×RBC + 0.623×Hb + 0.204×MCV + 0.537×Log(RBC fluo)
+ 0.174×Log(TBil) + 0.953×Log(ALP)
6
BALB/c
0
-2
C57BL/6
-4
-6
-8
-6
-4
-2
0
2
4
6
8
10
Function 1
x = 0.951×RBC - 1.102×Hb + 1.532×MCV - 1.131×Log(RBC fluo)
+ 0.986×Log(TBil) + 0.398×Log(ALP)
104
Lignées congéniques : bilan
BALB/c
C57BL/6
SJL
Impact sur l'état général
+++
++
+/-
PP érythrocytaire
++
++
++++
Anémie
+++
++
+
Ictère
+++
+/-
+/-
Accumulation de PP dans le foie
++
+++
+
Hépatite chronique
++
+++
+
105
Fonds génétique et souris GM
Souris G.M. souvent produites sur des fonds
hybrides
Les résultats doivent être comparables avec
ceux de la littérature
Plusieurs mutations peuvent être croisées pour
obtenir des doubles K.O., etc…
Le phénotype est souvent modifié par le fonds
génétique
106
Les lignées transgéniques (souris GM)
Les lignées génétiquement modifiées permettent
de répondre à plusieurs questions. Que se
passe-t-il :
- lorsqu'une souris exprime ce nouveau gène ?
- lorsqu'une souris exprime ce gène à un
niveau plus élevé que la normale ?
- lorsqu'une souris ne possède plus ce gène ?
- lorsque ces modifications sont induites dans
certains organes ou à certains moments ?
107
La transgénèse
But : ajouter un nouveau gène (ou de nouvelles copies d'un gènes)
dans le génome de la souris.
Isoler le gène
Œuf fécondé
108
La transgénèse
Tous les œufs n'intégrent pas le transgène.
Une fois que le transgène est intégré dans un chromosome, il se
transmet comme un caractère dominant (gain de fonction).
Le transgène s'insère en un seul endroit du génome, sous la forme de
plusieurs copies en tandem.
Selon le site d'intégration, le transgène peut ou non être exprimé
par les cellules.
On peut faire que le transgène sera exprimé à un temps ou dans un
tissu donné.
Par cette technique (assez simple), on ne contrôle ni le site
d'intégration, ni le nombre de copies du transgène), donc il y a
une grande variabilité d'un embryon à l'autre. Il faut étudier
plusieurs souris issues d'embryons différents.
109
La recombinaison homologue
But : inactiver un gène ou le remplacer par une autre version
Fabriquer une
copie inactive
du gène
Blastocyste
receveur
Insérer la copie
dans des
cellules ES
110
La recombinaison homologue
Technique beaucoup plus compliquée (culture de cellules souches,
injection de cellules dans le blastocyste).
On sélectionne l'évènement génétique souhaité en culture de cellules
et on n'injecte que les bonnes cellules.
Permet l'inactivation totale d'un gène ou son remplacement par une
autre version (par exemple le gène humain).
Permet d'intégrer des séquences permettant de contrôler
l'inactivation du gène à un moment ou dans un tissu donné.
111
Souris GM : Intercross
Le fonds génétique est :
129-B6
chimera
chimère
B6
Het.
Het..
WT
WT
Ho
Ho
He
He
F1
F2
Female Male
- Indéfini (pas de
comparaison avec
études
antérieures)
F3
DNA
(C57BL/6×
SJL/J)F1
- Différent entre
témoins et
mutants
WT
WT
He
He
- Non consanguin
(variabilité interindividuelle, faible
puissance pour
détecter des
effets)
- Instable (dérive
avec les
générations)
- Non reproductible
112
Souris GM : croisements avec F1 ou non-consanguine
Het.
B6x129
G1
B6xD2
Het.
B6xD2
B6xD2
G2
G3
Le fonds génétique est : - hétérogène entre hétéros et contrôles
- non défini et instable au cours des générations
113
Travailler avec des lignées co-isogéniques (KO)
129/SvJ
chimère
129/SvJ
Gene 1
129/SvJ
Heterozygotes
Homozygotes sur fonds 129/Sv
129/SvJ
129/SvJ
129/SvJ
Gene 2
Gene 3
Gene n
114
Souris GM : utiliser des lignées congéniques
129/SvJ
129/SvJ
129/SvJ
129/SvJ
Gene 1
Gene 2
Gene 3
Gene n
C57BL/6
C57BL/6
C57BL/6
C57BL/6
Gene 1
Gene 2
Gene 3
Gene n
115
Souris GM : travailler avec hybrides F1
129S1/Sv
Gene 1
C57BL/6
B6129SF1
Gene 1
Gene 1
116
Eléments de nomenclature
117
Transgènes
- Définition : mutations obtenues par injection d'une séquence d'ADN exogène dans un
embryon au stade une cellule.
118
Mutations ciblées
- Définition : mutations obtenues par inactivation d'un gène dans des cellules ES, injection
des cellules mutées dans un blastocyste receveur et implantation de l'embryon.
119
Nomenclature quizz
„
„
„
„
„
„
B6;129-Acvr2tm1Zuk
Une lignée de fonds mixte, dérivé de C57BL/6J et de
cellules souches d’origine 129, et portant une mutation ciblée
pour le gène Acvr2
STOCK Rb(16.17)5Bnr
Une lignée consanguine d’origine complexe ou inconnus et
portant une translocation chromosomique Robertsonienne
Rb(16.17)5Bnr.
C57BL/6N-Tg(CAG-RNAi:Trp53,-EGFP)1Pas
Lignée transgénique sous fonds C57BL/6N, pour un RNAi
ciblant le gène Trp53 et exprimant également la GFP, le tout
sous contrôle du promoteur CAG, et ayant été créée à
Pasteur
120
Hémizygote ou hétérozygote ?
-Définition hémizygote : une seule copie du gène est présente dans le génome, ex:
chromosomes sexuels et Transgénèse par insertion
- Définition hétérozygote : une copie « mutée » du gène est présente sur un
chromosome alors qu’une copie « sauvage » est présente sur l’autre chromosome, ex:
transgénèse par recombinaison homologue
Tg par insertion
Hémizygote
Homozygote
KO ou KI
Hétérozygote
Homozygote
121
Contrôle de qualité génétique
122
Le contrôle de qualité génétique
Contrôler que les caractéristiques génétiques
d'un groupe d'animaux de laboratoire sont
identiques à des valeurs de références.
S'assurer de la constance des propriétés
biologiques d'une colonie d'animaux de
laboratoire.
Effectuer des mesures génotypiques
appropriées à chaque type de population à
contrôler, en fonction des "dérives" qui
peuvent se produire
123
Caractère biologique intégré
Caractère résultant de l'interaction entre le
potentiel génétique d'un individu et son
environnement physique, chimique et
biologique, depuis la conception de l'individu
jusqu'au moment de l'analyse.
124
Variance phénotypique
Variance génétique
part explicable par des gènes
+
Variance d'environnement
+
Variance résiduelle
Génétique
part due à des paramètres
analysables
part due à des facteurs non
contrôlés ou à des fluctuations
individuelles
Environnement Résiduelle
125
Types de populations
Lignées consanguines
Colonies non consanguines
Lignées génétiquement modifiées
126
Lignées consanguines : variations
Mutations
Hétérozygotie résiduelle
Contamination génétique
127
Lignées consanguines : mutations
Modification ponctuelle du génome
- Inévitables et aléatoires
- Fréquence faible (10-5 - 10-6 / locus)
- Détection des mutations récessives
favorisée par la consanguinité
128
Lignées consanguines : mutations
Effet visible immédiatement
- mutation albinos sur fonds C57BL/6
- mutation de squelette, etc...
Effet sur phénotype non visible
- mutation Lpsd dans C3H/HeJ
- gène modificateur de Min
Mutations silencieuses
- dans parties non codantes des gènes
- les plus fréquentes
129
Lignées consanguines : mutations
Fréquence
A+/+ Am/m
Paramètre biologique
130
Lignées consanguines : hétérozygotie résiduelle
Résulte d'une consanguinité incomplète
- Incontrôlable
- Différente entre sous-lignées
131
Lignées consanguines : hétérozygotie résiduelle
Eviter la formation de sous-lignées
F31
F32
F33
132
Fréquence
Lignées consanguines : hétérozygotie résiduelle
F25b
F18 F25a
Paramètre biologique
133
Lignées consanguines : contamination
Mélange entre lignées
Modification massive du génome
134
Lignées consanguines : contamination
- Impact génétique majeur : catastrophe
- Irréversible
- Toujours des conséquences biologiques graves
- Détectable parfois facilement (couleur), toujours
par augmentation de fertilité
135
Lignées consanguines : contamination
A*B
Fréquence
A
Paramètre biologique
136
Lignées consanguines : que contrôler ?
Mutations : impossible
Hétérozygotie résiduelle : trop limitée
Contamination génétique
137
Marqueurs génétiques
Nombreux
Faciles à génotyper
Polymorphes entre les lignées
Stables dans le temps
138
Marqueurs de couleur de pelage
DBA/2 : a/a, b/b, d/d, +c/+c
Couleur
Lignée pure
F1 avec DBA/2
Lignée
Génotype
SJL/J
c
[+]
AKR
a, c
[a]
noire
BALB/c
b, c
[b]
marron
a, b, c
[a, b]
marron,
non agouti
A/J
139
Microsatellites
SSLP (simple sequence length polymorphism)
- Répétitions de séquence simple
- Environ 105 répétitions CA dans génome souris
CTAAGCTCGAT
..CTGATTCGAGCTAGG cacacacacaca TTGCTTGACAGGT..
..GACTAAGCTCGATCC gtgtgtgtgtgt AACGAACTGTCCA..
TGCTTGACAGG
Lignée
BALB/c
DBA/2
Nombre de répétitions
15
21
BALB/c BALB/c
F1
F1
Taille du fragment
127
139
DBA/2
DBA/2
140
Single Nucleotide Polymorphism (SNP)
Polymorphisme portant sur une paire de bases
- identifiés par reséquençage des génomes
- 4 types possibles :
C ⇔ T (ou G ⇔ A)
C ⇔ A (ou G ⇔ T)
C⇔G
T⇔A
- Présents dans les populations naturelles
- Fréquence de l'allèle le plus rare >1%
- Presque toujours di-alléliques
- cSNP : dans un cDNA
- par extension : toute variation de séquence (indel, > 1pb)
141
Single Nucleotide Polymorphism
Locus 1
Locus 2
Locus 3
C57BL6 CTAGTAGGATCGGCCC
DBA/2 CTAGTTGGATCGGTCC
GCTATACGGGGC
GCTATACGGGGC
CTGTAGTCGAGGGGC
CTGTAGTCGAGGGGC
BALB/c CTAGTAGGATCGGCCC
GCTAGCCGGGGC
CTATAGTCGACGGGC
CBA CTAGTAGGATCGGCCC
GCTATACGGGGC
CTATAGTCGACGGGC
C3H CTAGTTGGATCGGTCC
GCTATACGGGGC
CTATAGTCGAGGGGC
AKR CTAGTTGGATCGGTCC
A CTAGTTGGATCGGTCC
GCTAGCCGGGGC
GCTAGCCGGGGC
CTGTAGTCGAGGGGC
CTATAGTCGACGGGC
SJL CTAGTTGGATCGGTCC
GCTAGCCGGGGC
CTATAGTCGAGGGGC
FVB CTAGTTGGATCGGTCC
GCTAGCCGGGGC
CTATAGTCGAGGGGC
142
SNP et phylogénie des lignées
Wade et al. (2002), Nature, 420, 574-578
143
SNP et phylogénie des lignées
1638 SNP
Petkov et al. (2004), Genome Research, 14, 1806-11
144
SNP et phylogénie des lignées
Petkov et al. (2004), Genome Research, 14, 1806-11
145
SNP
Avantages
- très nombreux (plusieurs centaines de milliers décrits chez
l'homme et la souris)
- données massives de polymorphisme (reséquençage de lignées
consanguines)
- très denses : identification d'haplotypes communs
- génotypage automatisable à très grande échelle (peu coûteux)
Inconvénient
- génotypage demande équipement spécifique coûteux pour un
petit laboratoire
146
Lignées génétiquement modifiées
Tester la présence de la mutation
Tester l'absence de contamination du fonds génétique
Tester l'absence de contamination par d'autres
mutations
147
Colonies non consanguines : variations
Mutations
Evolution vers la consanguinité (dérive)
148
Colonies non consanguines : mutations
Effet "noyé" dans le polymorphisme naturel de la
colonie
Mutations récessives presque jamais à l'état
homozygote
149
Colonies non consanguines : consanguinité
Inévitable car population de taille finie
Modifie les fréquences alléliques
Conduit à la perte d'allèles
Effets probablement compensés
150
Colonies non consanguines : que contrôler ?
Taux d'hétérogénéité génétique mesurable
(fréquences alléliques de microsat.)
Locus
Allèles
a
b
c
d
L1
0,72
0
0,28
0
L2
0
1
0
0
L3
0,2
0,43 0,17 0,2
L4
0
0,68 0,22 0,1
- Quelle variation acceptable ?
151
Colonies non consanguines : que contrôler ?
Taux d'hétérogénéité génétique mesurable
(fréquences alléliques de microsat.)
Fluctuations très faibles ⇒ grands échantillons
Tests peu sensibles
Quelle valeur pour l'expérimentateur ?
152
Colonies non consanguines : que contrôler ?
Contrôle phénotypique
Mesurer moyenne et variance de paramètres utiles
variés
Contrôle des valeurs de référence de la colonie
Evaluation de la dérive et l'hétérogénéité
153
Contrôle génétique : un bilan
Impossible de contrôler toutes les variations
La qualité génétique repose avant tout sur la conduite
d'élevage
La cryopréservation permet de revenir à un fonds
génétique de référence (lignées consanguines)
Une faible dérive génétique est inévitable et fait
partie du "réactif animal"
154
La conduite d’élevage au Jackson Laboratory
- Nb de générations limité en
« Foundation & Expansion »
- 3 types de colonies séparées
- Apport régulier en production
depuis stock fondateur
- Renouvellement fondateurs
(embryons congelés) après F5
155
Quelques conclusions…
- Chaque espèce de souris résulte de la co-évolution d'allèles qui sont capables de
fonctionner ensemble. Les souris de laboratoire dérivent d'hybrides artificiels entre
plusieurs sous-espèces.
- Les populations d'animaux de laboratoire ont des structures variées qu'il est
important de bien connaître pour bien les utiliser.
- Dans chaque lignée consanguine est fixée une combinaison particulière. C'est cette
combinaison qui définit les caractéristiques de la lignée. Ce patrimoine génétique est
en interaction permanente avec l'environnement pour déterminer le phénotype.
- Un phénotype est rarement déterminé par un seul gène mais résulte d'interactions
souvent complexes entre un ou quelques gènes majeurs et de nombreux gènes
modificateurs.
- Le contrôle de qualité génétique apporte en général peu d'information car il ne peut
contrôler qu'une partie limitée de la variation génétique au cours du temps.
- Les données de séquence, d'expression et de phénotype qui sont produites sur des
lignées consanguines, recombinantes consanguines ou recombinantes congéniques vont
permettre d'identifier des corrélations, des réseaux d'interaction et des gènes qui
contrôlent des caractères complexes, par une approche in silico.
156
Combler le « fossé » biologique
- Projets de mutagenèse à l’ENU
- Japon (RIKEN)
- Angleterre (Harwell)
- Allemagne (GSF)
- USA (Baylor College, McLaughlin Research Institute,
NorthWestern…)
- Projets de mutagenèse de cellules ES
- EUCOMM : European Conditional Mouse Mutagenesis
- http://www.eucomm.org/
- NIH KOMP : Knock-Out Mouse Project
- http://www.komp.org/
157
Produire de nouveaux modèles
Phenotypedriven
Induire des mutations
aléatoires dans le génome
Cribler les souris
mutantes
Phénotype
Créer une mutation
dans le gène
Localiser puis identifier
le(s) gène(s) muté(s)
Gène(s)
Genedriven
Sélectionner les gènes
probablement impliqués
158
Pour en savoir plus
sur la souris :
159
Téléchargement