Modèles animaux : génétique de la souris Jean Jaubert 1 Plan général Eléments de nomenclature - Origine des souris de laboratoire - Données Génétiques de base pour la souris - Les types de lignées : consanguines, congéniques, consomiques, recombinantes consanguines, recombinantes congéniques; les colonies non consanguines - Effet du fonds génétique - Contrôle de qualité génétique - La séquence et après… 2 Origine des souris 3 Origine des souris de laboratoire Ancestral Mus musculus species domesticus castaneus molossinus European fancy mouse 1M années musculus East asian fancy mouse 2000 ans 100 ans Laboratory strains Wade et al. (2002), Nature, 420, 574-578 4 Phylogénie des souris domesticus molossinus castaneus M. musculus musculus bactrianus M. spicilegus M. macedonicus M. spretus M. caroli M. cooki M. cervicolor M.A. 0 0,23 0,35 1,10 1,75 2,40 5 Miss Abbie C. Lathrop Origine des principales lignées consanguines d'après Mouse in Biomedical Research Ed. by Henry L. Foster, J. David Small and James G. Fox 6 Academic Press, 1981 William E. Castle (1867-1962) Clarence C. Little (1888-1971) Leonell C. Strong 7 DBA/2 SJL/J FVB/N 129 C3H BALB/c ICR C57BL/6 CAST ftp://ftp.informatics.jax.org/pub/datasets/misc/genealogy/genealogy.pdf 8 Eléments de nomenclature 9 La nomenclature - Elle est indispensable - Elle doit être rigoureuse - Elle apporte des informations … malheureusement, les règles dépendent des espèces ! Référence (Mouse Genome Informatics ou MGI) - http://www.informatics.jax.org/mgihome/nomen 10 Définitions Allèle Variant de séquence d'un gène, identifié au niveau de l'ADN (polymorphisme) ou d'un phénotype (mutant). Locus Site quelconque du génome, fonctionnel ou non, qui peut être cartographié par une analyse génétique formelle. Gène Une séquence d'ADN à laquelle on peut attribuer une fonction ou un caractère. Gènes chez la souris Le symbole est en italiques, le premier caractère est en majuscule, les autres en minuscule (ex : Apc, Adenomatosis polyposis coli). Les protéines sont écrites en majuscules et sans italiques (APC). Gènes chez l'homme Le symbole est en italiques, tous les caractères sont en majuscule (ex : APOA1). Les protéines sont en majuscules et sans italiques (APOA1). 11 Définitions Marqueur Moyen permettant l’identification d’un gène ou d’un locus Haplotype Association d’allèles (tout type de marqueurs) génétiquement liés Variant d’épissage Formes d’épissage alternatives d’un gène résultant de la combinaison de différents exons Mutation Allèle conférant une différence phénotype identifiable par rapport à la référence « sauvage » Génotype Description de la composition génétique d’un animal (allèles particuliers à des loci particuliers) Phénotype Résulte de l’interaction entre génotype et environnement, mesurable Dominant et Comment est hérité le phénotype récessif : les 2 allèles sont porteurs du variant ou de la mutation récessif Dominant : un seul variant allèlique est suffisant Quantitativ e Trait Loci (QTLs) Loci polymorphes contenant des allèles affectant de façon différente l’expression de traits phénotypiques quantitatifs ou à distribution continue 12 « Laboratory codes » Le Laboratory Registration Code or Laboratory code Usuellement composé de 3 à 4 lettres (1ère lettre en majuscule, ensuite en minuscules) identifie un institut, un laboratoire ou un chercheur qui a produit ou détient de stocks d’animaux Sous-lignées, congéniques, autres lignées… devraient être identifiées par ce Lab code, pour les distinguer entre elles Attribués par « Institute of Laboratory Animal Research (ILAR) » (http://dels-old.nas.edu/ilar_n/ilarhome/register_lc.php). Exemples de Laboratory codes : J Rl Jr Mcw Kyo Rj Hsd Crl Pas The Jackson Laboratory W.L. and L.B. Russell John Rapp Medical College of Wisconsin Kyoto University Centre d’élevage Robert Janvier Harlan Sprague Dawley Charles River Laboratories Institut Pasteur… 13 Données génétiques de base chez la souris 19 chromosomes acrocentriques + XX ou XY Environ 1500 cM (1 cM de souris = 1,8 Mb d’ADN) 10.000 marqueurs (6000 microsatellites) = résolution théorique 0,1 cM Nombreuses homologies de synténie avec les chromosomes humains 14 Homologies de synténie homme-souris Cela permet de faire des prédictions sur la probable localisation d’un gène lorsque celle ci est connue dans une espèce et pas dans l’autre Cela permet aussi de valider certains modèles A a b B C ? D E c e centromère Sur de courtes distances, l’arrangement linéaire des gènes sur les chromosomes est le même chez l’homme et chez la souris d 15 Homologies interspécifiques Souris Homme Chr 5 Chr 18 Chr 2 Chr 1 16 Le génome de l’homme Compétition public/privé Différences de méthodes: WGS vs Contig-based The sequence of the human genome (CELERA) Science. 2001 Feb 16; 291(5507): 1304-51 Initial sequencing and analysis of the human genome (Human genome consortium) Nature. 2001 Feb 15; 409(6822): 860-921 1ers assemblages mis en ligne en 2001: golden path 17 Le séquençage des génomes 18 Le génome de la souris 3 x 109 bp (comme l ’homme), environ 750 Mo Certainement > 30,000 gènes mais probablement < 100,000 Pas plus de 5 à 8 % d’ADN code pour des protéines Beaucoup de séquences répétées (2 à 105 copies par génome) Chr10 souris = génome de la Drosophile Initial sequencing and comparative analysis of the mouse genome. Nature. 2002 Dec 5; 420(6915): 520-62 19 Les autres génomes Genome sequence of the Brown Norway rat yields insights into mammalian evolution Nature. 2004 Apr 1;428(6982): 493-521 Genome sequence, comparative analysis and haplotype structure of the domestic dog Nature. 2005 Dec 8;438(7069): 803-19 Should the draft chimpanzee sequence be finished ? Trends Genet. 2006 Mar;22(3): 122-5 20 La fuite en avant… Séquenceurs haut-débit: 454 et Solexa Puces hautes densités en SNPs (1M) pour génotypage et/ou recherche de CNVs chez l’homme et chez la souris 17 autres lignées de souris en cours de séquençage 74 autres lignées de souris pour avec données de SNPage haute densité Projet 1000 Génomes (Humain) pour fin 2009 21 Bases de données phénotypiques souris • Souris • MGI: //www.informatics.jax.org • Phenome Mouse: //phenome.jax.org/pubcgi/phenome/mpdcgi?rtn=docs/home • Trans-NIH Knock-out mouse project: en construction • Mouse Knockout & Mutation Database: //research.bmn.com/mkmd payant • Homme • OMIM: //www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM 22 Bases de données marqueurs/SNPs souris • Whitehead/ MIT: //www.broad.mit.edu/tools/data/genvar.html • Genethon: //www.cephb.fr/ceph-genethon-map.html • NCBI: //www.ncbi.nlm.nih.gov/gquery/gquery.fcgi/ ou, …gov/SNP/MouseSNP.cgi • MGI: //phenome.jax.org/pub-cgi/phenome/mpdcgi?rtn=snps/door • Roche (SNPs): //mousesnp.roche.com/cgi-bin/msnp.pl • WTCHG: //zeon.well.ox.ac.uk/rmott-bin/strains.cgi 23 Bases de données séquence souris • NCBI: //www.ncbi.nlm.nih.gov/mapview • ENSEMBL: //www.ensembl.org • UCSC: //genome.ucsc.edu DOE Joint Genome Institute: //www.jgi.doe.gov (Community Sequencing Programs) • 24 Les populations de souris de laboratoire Lignée consanguine (inbred strain) Lignée co-isogénique Lignée congénique (et speed congenic) Colonies non consanguines Lignées recombinantes consanguines Lignées recombinantes congéniques 25 Lignée consanguine Lignée DBA/2J F175 F176 F177 26 Les quatre types de croisement INCROSS (OUT)CROSS A/A x A/A a/a x a/a A/A x a/a A/A a/a A/a BACKCROSS INTERCROSS A/a x a/a A/a x A/a 50% A/a 50% A/a 25% a/a 25% A/A 50% a/a 27 Quatre types de croisements I) INCROSS IV) CROSS Descendants A/A x A/A a/a x a/a A/A x a/a Type Génotypes a/a A/A a/a A/a I a/a x a/a 1 II) BACKCROSS III) INTERCROSS II a/a' x a/a 0,5 A/a x a/a A/a x A/a 50% A/a 50% a/a 50% A/a 25% a/a 25% A/A a/a' x a'/a' III a/a' x a/a' IV a/a x a'/a' 0,25 a/a' a'/a' 0,5 0,5 0,5 0,5 0,25 1 Fréquences des types de croisements à la génération N+1 en fonction de la génération N Type (gén. N) I II III IV I 1 0,25 0,125 Génération N+1 II 0,5 0,5 III IV 0,25 0,25 1 0,125 28 Evolution des types de croisements au cours des générations Type Génotypes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 I a/a x a/a 0,125 0,281 0,414 0,525 0,616 0,689 0,748 0,796 0,835 0,867 0,892 0,913 0,929 0,943 0,954 0,963 0,970 0,976 0,980 0,984 II a/a' x a/a 0,500 0,375 0,344 0,273 0,225 0,181 0,147 0,119 0,096 0,078 0,063 0,051 0,041 0,033 0,027 0,022 0,018 0,014 0,012 0,009 III a/a' x a/a' 0,250 0,313 0,203 0,176 0,138 0,113 0,091 0,073 0,059 0,048 0,039 0,031 0,025 0,021 0,017 0,013 0,011 0,009 0,007 0,006 IV a/a x a'/a' 0,125 0,031 0,039 0,025 0,022 0,017 0,014 0,011 0,009 0,007 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 Hétéro 0,875 0,719 0,586 0,475 0,384 0,311 0,252 0,204 0,165 0,133 0,108 0,087 0,071 0,057 0,046 0,037 0,030 0,024 0,020 0,016 1,000 0,900 0,800 Fréquence 0,700 Type I 0,600 Type II 0,500 Type III 0,400 Type IV 0,300 0,200 0,100 0,000 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2 Générations 29 Évolution du pourcentage du génome à l'état hétérozygote au cours des générations de consanguinité Pourcentage des locus à l'état hétérozygote 1 0,1 0,01 0,001 0 5 10 15 20 25 Nombre de générations de consanguinité 30 Lignées consanguines : sous-lignées F16 F17 F18 F19 31 Entretien d'une lignée consanguine F16 F17 F18 F19 32 Propriétés des lignées consanguines - Populations génétiquement homogènes et (assez) stables dans le temps - Tous les individus sont identiques : un couple suffit à définir la lignée (ex : duplication ou congélation de la lignée) - Pas de variance phénotypique d'origine génétique : variance phénotypique totale faible, plus grande facilité à mettre en évidence une différence - Plusieurs centaines de lignées consanguines disponibles - Possibilité d'étudier l'effet du sexe à génotype constant - Possibilité d'étudier un phénotype apparaissant avec une fréquence faible - Certaines lignées ont des propriétés biologiques très particulières (NOD, DDK, etc…) et sont des modèles d'étude - Croisements entre lignées consanguines : configurations génétiques simples 33 Lignées consanguines : avantages Faible variabilité biologique : grande puissance pour détecter des différences Nombreuses lignées disponibles avec caractéristiques originales Possibilité d'identifier des gènes responsables de différences phénotypiques 34 Lignées consanguines : limites Fragilité, difficulté d'élevage Sensibilité à l'influence de facteurs génétiques (mutations) et non génétiques (environnement) Risque de faire des observations non représentatives ou généralisables 35 Mouse Phenome Database (1) Red blood cell count (x109/mL) 36 Mouse Phenome Database (2) Phospholipid protein transfer activity after 6 wks on atherogenic diet www.jax.org/phenome 37 Eléments de nomenclature 38 Lignées consanguines - Définition : au moins 20 générations FxS; générations de consanguinité : F50 - Symbole : une lettre majuscule + autres lettres ou chiffres ex : A, AKR, NZB, C3H exception : 129 - Sous-lignées : barre oblique + chiffre : DBA/2 + lettre(s) : C3H/He, FVB/N + les deux : C57BL/6J 39 Hybrides F1 - Définition : issus du croisement entre deux lignées consanguines - Symbole : abréviation en majuscules des deux lignées parentales 40 Abréviations autorisées 129 129 strains (may include subtype, e.g., 129S6 for strain 129S6/SvEvTac) A A strains A K AKR strains B C57BL B 6 C57BL/6 strains B10 C57BL/10 strains B R C57BR/CD C BALB/c strains C 3 C3H strains C B CBA D 1 DBA/1 strains D 2 DBA/2 strains H R HRS/J L C57L/J R 3 RIIIS/J J SJL SW SWR 41 Hybrides F2 - Définition : issus du croisement entre des F1 issus de deux lignées consanguines - Symbole : abréviation en majuscules des deux lignées parentales 42 Nomenclature quizz BALB/cByJRj La lignée BALB, sous-lignée /c, crée par le Dr Bayley élevée au Jackson puis maintenue par l’elévage Janvier ACI/N (F159) Lignée de rat ACI, élevée au NIH avec 159 générations de croisements frères x soeurs. 43 Lignée consanguine ségrégeant pour une mutation récessive viable et fertile à l'état homozygote Lignée 129/SvJ +/bal bal/bal bal/bal +/bal +/bal bal/bal F?+6 F?+7 F?+8 44 Lignée consanguine ségrégeant pour une mutation récessive létale (ou stérile) Lignée BALB/cJ +/rl F?+26 +/rl F?+27 [rl] rl/rl [+] +/rl ? [+] +/rl ? Au moins un [rl] dans les 10 premiers petits: les deux parents sont +/rl Nouveaux couples à partir des petits normaux frères et sœurs de [rl] [+] +/rl ? [+] +/rl ? Pas de [rl] dans les 10 premiers petits: l'un des parents est "probablement" +/+ Éliminer le couple F?+28 45 Lignée co-isogénique Lignée C57BL/6J [+] [+] F65 [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] [+] +/c [+] +/c [+] +/c +/c [c] c/c +/c F66 F67 F68 F69 F70 46 Eléments de nomenclature Allèles chez Le symbole est en italiques et en exposant du symbole du gène. Le premier caractère est une majuscule si la mutation est (co-)dominante la souris Min (ex: Apc , multiple intestinal neoplasia). C'est une minuscule si la mutation est récessive (ex: Leprdb, gène = leptin receptor, allèle = diabetes). Quand un allèle n'est reconnu que par un phénotype mutant, les symboles du gène et de l'allèle sont identiques (db était le symbole de diabetes). 47 Mutations spontanées ou induites non ciblées - Définition : mutations apparues spontanément ou obtenues après mutagénèse physique (rayonnements ionisants) ou chimique aléatoire. - Symbole : Nom de la lignée consanguine + symbole de l'allèle muté 48 Mutations co-isogéniques -Définition : lignée consanguine différent pour un seul locus (en général suite à une mutation). - Symbole : symbole de la lignée + tiret et le symbole du gènes différent, en italique C57BL/6JEi-tth The tremor with tilted head mutation in the C57BL/6JEi strain. C57BL/6J-Aqp2cph The congenital progressive hydronephrosis mutation in the aquaporin 2 gene arose on the C57BL/6J strain 49 Lignée congénique - Lignée consanguine dans laquelle on a introduit une mutation ou un transgène par croisement +/+ "C on gé nis a tio n" Tg/+ Tg/+ 50 Lignée congénique pour un locus Backcross Lignée FVB/N Tg/+ +/+ Lignée C57BL/6 Identification des Tg/+ C57BL/6 +/+ F1 = N1 Identification des Tg/+ C57BL/6 +/+ N2 Identification des Tg/+ C57BL/6 +/+ N3 Répéter jusqu'à N10 Identification des Tg/+ N10 Identification des Tg/Tg N10F1 Lignée congénique de C57BL/6 51 Lignée congénique pour un locus Intercross Lignée BALB/cJ c/c +/+ +/c +/c Identification des c/c +/c Identification des c/c C57BL/6 +/+ +/c C57BL/6 +/+ Lignée C57BL/6 F1 = N1 F2 = N1F1 N2 F2 = N2F1 Répéter jusqu'à N10 Identification des c/c Identification des c/c Lignée congénique de C57BL/6 N10F1 N10F2 52 Lignée congénique : proportions théoriques de provenance du génome Génération F1 N2 N3 N4 N5 N6 N7 N8 N9 N10 % moyen segments hét. % génome donneur % génome receveur 100 50 25 12,5 6,3 3,1 1,6 0,8 0,4 0,2 50 25 12,5 6,25 3,125 1,56 0,78 0,39 0,2 0,1 50 75 87,5 93,7 96,7 98,4 99,2 99,6 99,8 99,9 53 Lignée congénique : évolution du segment transféré 30 25 cM 20 15 10 5 0 5 10 15 20 25 30 35 40 45 50 Générations de backcross (N) 54 Lignée congénique : évolution du segment transféré A B B Tg N2 Tg B Tg Tg N1 N3 N4 B Tg B N5 B Tg 55 Lignée congénique : sélection par marqueurs B F1 X X X m1 m1 m2 B m2 m1 B m2 56 Lignée speed congénique Wakeland et al., Immunology today, 1997, 18, 472-477 57 Lignée speed congénique Souris D1Mit12 D2Mit4 D4Mit7 …… D19Mit65 % B/B 1 B/B B/B A/B ... A/B 53 2 B/B A/B B/B ... A/B 49 3 A/B A/B A/B ... B/B 41 4 A/B B/B B/B … A/B 55 5 A/B B/B A/B … B/B 62 6 B/B B/B A/B … B/B 74 …. …. …. …. …. …. …. 96 B/B A/B A/B … A/B 57 97 B/B A/B B/B … B/B 43 98 A/B A/B B/B … B/B 52 99 A/B A/B B/B … A/B 48 100 B/B B/B A/B … B/B 46 % B/B 47 54 50 … 42 58 Lignée speed congénique 59 Lignée speed congénique Nb souris N2 (15%) N3 (3%) N4 (<1%) 60 30 30 50 25 50 40 20 40 30 15 30 20 10 20 10 5 10 0,3 0,5 0,7 0,05 0,15 0,25 0,01 0,03 0,05 Hétérozygotie Intercross pour produire la lignée congénique Voire même possibilité de lignée « Supersonique » congénique ! 60 Lignée consomique ou CSS - Lignée consanguine dans laquelle on a introduit par croisement une paire de chromosomes d’origine différente F1 B A B Consomique A-Chr XB 61 Eléments de nomenclature 62 Lignées congéniques - Définition : produites par >10 générations de croisement sur une lignée consanguine - Symbole : abbréviation en majuscules des deux lignées parentales + symbole de l'allèle provenant de la lignée donneuse 63 Lignées consomiques - Définition : lignée consanguine dans laquelle on a transféré par croisements répétés un chromosome entier d’une autre lignée - Symbole : Lignée receveuse-Chr #Lignée Donneuse SHR-Chr YBN Pour cette lignée consomique de rat, le chromosome Y de BN a été transféré par backcross répétés sur le fonds SHR. C57BL/6J-Chr 19SPR Pour cette lignée consomique de souris, un Chromosome 19 s’origine Mus spretus a été backcrossé sur C57BL/6J. C57BL/6J-Chr 1A/J Chr 3DBA/2J Pour cette lignée consomique de souris, le Chromosome 1 de la lignée A/J et le Chromosome 3 de la lignée DBA/2J ont été backcrossés sur C57BL/6J. 64 Les colonies non consanguines - Produire des animaux qui ressemblent davantage aux populations naturelles - Entretenir une hétérogénéité génétique - Eviter au maximum les croisements consanguins - Objectif : < 1% d'augmentation de la consanguinité par génération - La population est définie par des fréquences alléliques 65 Colonies non consanguines Rotation des géniteurs Colonie de grande taille 66 Propriétés des colonies non consanguines - Populations génétiquement hétérogènes, plus proches des populations naturelles - Robustes et faciles d'entretien - Tous les individus sont différents : il faut un très grand échantillon d'individus pour s'approcher de la composition génétique - L'entretien d'une colonie non consanguine doit se faire à grande échelle, avec des règles strictes Fréquence - Variance phénotypique totale assez grande : moins de puissance pour mettre en évidence une différence Colonie non consanguine Lignée consanguine Paramètre 67 Origine colonies non consanguines La plupart des colonies non-consanguines ont une origine commune : - Elles dérivent d’une seule colonie Swiss d’environ 200 souris à partir de laquelle 2 mâles et 7 femelles ont été importées au Rockefeller Institute for Medical Research in New York - Outbred Swiss stocks disponibles actuellement : NMRI, CFW, MF1, CD1, ICR, NIHS, ND4 and SW. Toutes les outbreds ne proviennent pas de Lausanne en Suisse (Switzerland). - Exemples de lignées Non-Swiss : CF-1, NSA, OF1, SABRA et TO. 68 Origine colonies non consanguines 69 - Manque de puissance ex : sommeil après hexobarbital : - de 18 à 48 min (sd 3,2 min) chez consanguines - 43 et 48 min (sd 13,5 min) dans 2 stocks pour rechercher une différence de 4 min. (5%, puissance 80%) : - 12 souris consanguines - 180 souris non consanguines puissance pour détecter 4 min. de différence avec 20 souris : - 97% avec souris consanguines - 14% avec souris non consanguines 70 Faut-il vraiment continuer d'utiliser des souris non consanguines ? - Composition génétique de chaque stock est mal connue, mal contrôlée - Hétérogénéité génétique très variable d'un stock à l'autre - Accidents de population souvent mal documentés (bottleneck, sélection directionnelle) avec conséquences importantes - Ségrègent parfois pour des mutations récessives délétères - Génétiquement instables - Et pourtant: résolution génétique plus fine (math), variabilité plus proche de ce qu’on observe chez l’homme 71 Colonies non consanguines : avantages Grande robustesse et prolificité, faible coût Génétiquement hétérogènes donc plus représentatives d'une population naturelle 72 Colonies non consanguines : limites Résultats plus hétérogènes d'un individu à l'autre Populations difficiles à stabiliser génétiquement Nécessité de recourir à de groupes importants 73 Eléments de nomenclature 74 Colonies non consanguines Pour les outbreds, la racine de la lignée est précédée par le code ILAR de l’institution qui maintient la colonie. Tac:ICR Le stock ICR outbred maintenu par Taconic Farms, Inc. Hsd:NIH Swiss Le stock NIH Swiss outbred maintenu par Harlan Sprague Dawley, Inc.. C57BL/6Tac-Bmp4tm1Blh[cc] Une colonie fermée de souris provenant de la lignée consanguine C57BL/6Tac et portant une mutation ciblée (tm1Blh) sur le gène Bmp4 75 Conplastiques Les lignées conplastiques sont des lignées dans lesquelles le génome « nucléaire » d’une lignée a été introduit dans le cytoplasme d’une autre, i.e., le donneur mitochondrial est toujours le parent femelle lors du programme de backcross répétés NUCLEAR GENOME-mt C57BL/6J-mt CAST/Ei CYTOPLASMIC GENOME Une lignée avec le génome nucléaire de C57BL/6J et le génome cytoplasmique (mitochondrial) de CAST/Ei. 76 Les lignées recombinantes consanguines (Recombinant inbred strains) Lignée A Lignée B F1 F2 F1 .... 20 générations de croisements consanguins AXB-1 AXB-25 77 Les lignées recombinantes consanguines 25 couples F2 F1 A ….. B F20 ….. AXB-1 AXB-25 78 Propriétés des lignées rec. consanguines - Populations génétiquement homogènes et stables (consanguines) - Génotypes recombinants fixés de façon définitive - Possibilité de les reproduire à l'infini - Cumuler les observations faites dans plusieurs laboratoires - Etudier l'effet du sexe à génotype recombinant constant - Etudier des caractères quantitatifs avec répliques, des caractères mesurés par moyenne et écart-type, par des pourcentages, des taux de survie, etc... 79 Grisel et al., J. Neurosci., 1997, 17, 745-754 80 Les lignées recombinantes congéniques (Recombinant congenic strains) Lignée A Lignée B F1 BC1 B Lignée B .... B 20 générations de croisements consanguins AcB-1 AcB-25 81 Les lignées recombinantes congéniques 25 couples BC x B F1 BC × A BC × B ….. × B B × 20 générations de croisements consanguins B F20 ….. AcB-1 AcB-25 82 Propriétés des lignées rec. congéniques - Tous les avantages des lignées recombinantes consanguines : stabilité, génotypes fixés, résultats cumulables, ... - Plus grande puissance pour l'étude des caractères multigéniques et la recherche d'interactions épistatiques 9 8 7 6 5 4 3 2 1 0 26 lignées recombinantes congéniques 14 12 Nombre de lignées Nombre de lignées Caractère contrôlé par 5 locus 26 lignées recombinantes consanguines 0 1 2 3 4 5 Nombre de locus différant entre une lignée recombinante consanguine et la lignée parentale A 10 8 6 4 2 0 0 1 2 3 4 5 Nombre de locus différant entre une lignée recombinante congénique et la lignée receveuse B 83 Eléments de nomenclature 84 Lignés recombinantes consang. ou cong. CXB Lignée recombinant consanguine produite par croisement entre les lignées BALB/c x C57BL/6J BXD1, BXD2, BXD3 Membres du panel de lignées RI BXD obtenues par croisement entre C57BL/6 x DBA/2. CcS Lignée Recombinante congénique entre BALB/c receveuse et STS donneur. 85 Le "Collaborative Cross" - Produire un jeu de lignées consanguines hybrides entre 8 lignées consanguines très différentes - Mélanger le génome de différentes sous-espèces pour obtenir un "feu d'artifice" de phénotypes nouveaux - Objectif : > 1000 lignées ! Actuellement : > 700 en cours - Intérêts : → Créer des phénotypes très variés dans des lignées stables → Avoir les moyens d'identifier les gènes responsables (voies métaboliques) → Permettre de comparer phénotypes / expression / génotypes 86 PWD CAST/Ei WSB/Ei A/J NOD/Lt NZO 129S1/Sv C57BL/6 Le "Collaborative Cross" 87 Le "Collaborative Cross" 1.000 lignées indépendantes dont le génome est un réassortiment unique 88 GeneNetwork.org Génotypes Expression des gènes Phénotypes Quels gènes contrôlent le niveau d'expression ? Lignées Quels gènes sont co-exprimés ? Quels phénotypes sont corrélés ? Quels gènes ont un niveau d'expression corrélé à un phénotype ? Quels gènes contrôlent un phénotype ? 89 GeneNetwork.org 90 Effet du fonds génétique 91 Effet du fonds génétique: exemples diabetes (db), obese (ob) Multiple intestinal neoplasia (Min) EGF-R knock-out C57BL/6 C57BL/Ks obésité diabète (B6 x AKR)F1 C57BL/6 ~ 6 polypes ~ 30 tumeurs intestinales CD-1 CF-1 survie à 3 semaines mort à l'implantation 92 Effet du fonds génétique Modèles animaux et pathologie humaine B A C Lignée consanguine Fréquence Population humaine Sévérité du phénotype 93 Gènes modificateurs chez la souris Peuvent être localisés dans des croisements - F2 ou BC à partir de lignées consanguines Leur fonction physiologique peut être étudiée - lignées congéniques, variants présents dans des lignées consanguines - lignées transgéniques, KO, KI, KO conditionnels Fournissent des candidats pour l'homme - difficiles à identifier chez l'homme (gènes x environnement) - homologies homme-souris : gènes, fonctions, voies métaboliques Enjeu majeur pour les maladies monogéniques - dépistage précoce des formes à évolution sévère - traitements pour réduire la gravité des symptômes 94 Ferrochelatase deficiency - Apparue après mutagénèse à l'ENU - Backcross répétés sur BALB/c - Anémie, ictère, hépatomégalie, splénomégalie - Dépôts de pigment brun et de cristaux dans les cellules de Küppfer et les voies biliaires - Déficit partiel en ferrochelatase : 3 à 5 % d'activité résiduelle chez les homozygotes 55% d'activité résiduelle chez les hétérozygotes 95 Ferrochélatase Me Vi Me Vi Fe2+ N Me NH Pr Me HN Vi N Pr N Me Pr N Fe2+ N N Ferrochélatase Me Protoporphyrine IX Me Pr Vi Me Hème - Membrane interne de la mitochondrie - Hème : érythropoïèse, cytochromes 96 Protoporphyrie érythropoïétique (homme) - Déficit partiel en ferrochelatase - Photosensibilité d'apparition précoce (jeune enfant) - Accumulation de protoporphyrines (peau, foie) - < 5% des cas : accumulation massive de PP dans le foie, troubles excrétoires, lésion hépatocellulaires, insuffisance hépatique fatale 97 Physiopathologie de le PPE PEAU Photosensibilité ERYTHROBLASTES PLASMA Cristaux, lésions et mort cellulaires Protoporphyrine Fe++ Ferrochélatase Dégradation Bilirubine HEME ANEMIE FOIE Conjugaison Excrétion biliaire ICTERE INSUFFISANCE HEPATIQUE 98 Effet du fonds génétique Non-transgéniques f/f 50% BALB/cJ 25% SJL 25% C57BL/6J SJL cDNA ferrochelatase humaine C57BL/6J Hormones +/+ +/f +/f BALB/cJ Proto: ++ Ictère: - f/f Proto: +++ Ictère: +++ 99 Lignées congéniques BALB/cJ f/f SJL C57BL/6J f/f f/f 100 Recherche de gènes modificateurs Gènes modificateurs Quel phénotype étudier ? Fonctions cellulaires SOUSPHENOTYPES Interactions cellulaires / tissulaires Fonctions biologiques EVALUATION CLINIQUE Etat physiologique global 101 Lignées congéniques (3 mois) BALB/c C57BL/6 SJL 32 Masse corporelle (g) 30 28 26 24 22 BALB/cJ 11 GR (x109/mL) SJL 16 Hb (g/dL) 46 12 44 11 +/+ fech/fech 10 Ht (%) 54 48 13 8 fech/fech 50 14 9 +/+ 52 15 10 7 20 42 +/+ fech/fech 40 +/+ fech/fech 102 Lignées congéniques (3 mois) BALB/c C57BL/6 SJL Fluorescence GR (x1000) 90 80 70 60 50 40 30 20 10 0 +/+ fech/fech Bilirubine totale (μmol/L) 160 140 120 100 80 60 40 20 0 +/+ fech/fech PAL (UI/L) 600 500 400 300 200 100 0 +/+ fech/fech 103 Analyse factorielle discriminante 4 SJL/J 2 Function 2 y = 0.025×RBC + 0.623×Hb + 0.204×MCV + 0.537×Log(RBC fluo) + 0.174×Log(TBil) + 0.953×Log(ALP) 6 BALB/c 0 -2 C57BL/6 -4 -6 -8 -6 -4 -2 0 2 4 6 8 10 Function 1 x = 0.951×RBC - 1.102×Hb + 1.532×MCV - 1.131×Log(RBC fluo) + 0.986×Log(TBil) + 0.398×Log(ALP) 104 Lignées congéniques : bilan BALB/c C57BL/6 SJL Impact sur l'état général +++ ++ +/- PP érythrocytaire ++ ++ ++++ Anémie +++ ++ + Ictère +++ +/- +/- Accumulation de PP dans le foie ++ +++ + Hépatite chronique ++ +++ + 105 Fonds génétique et souris GM Souris G.M. souvent produites sur des fonds hybrides Les résultats doivent être comparables avec ceux de la littérature Plusieurs mutations peuvent être croisées pour obtenir des doubles K.O., etc… Le phénotype est souvent modifié par le fonds génétique 106 Les lignées transgéniques (souris GM) Les lignées génétiquement modifiées permettent de répondre à plusieurs questions. Que se passe-t-il : - lorsqu'une souris exprime ce nouveau gène ? - lorsqu'une souris exprime ce gène à un niveau plus élevé que la normale ? - lorsqu'une souris ne possède plus ce gène ? - lorsque ces modifications sont induites dans certains organes ou à certains moments ? 107 La transgénèse But : ajouter un nouveau gène (ou de nouvelles copies d'un gènes) dans le génome de la souris. Isoler le gène Œuf fécondé 108 La transgénèse Tous les œufs n'intégrent pas le transgène. Une fois que le transgène est intégré dans un chromosome, il se transmet comme un caractère dominant (gain de fonction). Le transgène s'insère en un seul endroit du génome, sous la forme de plusieurs copies en tandem. Selon le site d'intégration, le transgène peut ou non être exprimé par les cellules. On peut faire que le transgène sera exprimé à un temps ou dans un tissu donné. Par cette technique (assez simple), on ne contrôle ni le site d'intégration, ni le nombre de copies du transgène), donc il y a une grande variabilité d'un embryon à l'autre. Il faut étudier plusieurs souris issues d'embryons différents. 109 La recombinaison homologue But : inactiver un gène ou le remplacer par une autre version Fabriquer une copie inactive du gène Blastocyste receveur Insérer la copie dans des cellules ES 110 La recombinaison homologue Technique beaucoup plus compliquée (culture de cellules souches, injection de cellules dans le blastocyste). On sélectionne l'évènement génétique souhaité en culture de cellules et on n'injecte que les bonnes cellules. Permet l'inactivation totale d'un gène ou son remplacement par une autre version (par exemple le gène humain). Permet d'intégrer des séquences permettant de contrôler l'inactivation du gène à un moment ou dans un tissu donné. 111 Souris GM : Intercross Le fonds génétique est : 129-B6 chimera chimère B6 Het. Het.. WT WT Ho Ho He He F1 F2 Female Male - Indéfini (pas de comparaison avec études antérieures) F3 DNA (C57BL/6× SJL/J)F1 - Différent entre témoins et mutants WT WT He He - Non consanguin (variabilité interindividuelle, faible puissance pour détecter des effets) - Instable (dérive avec les générations) - Non reproductible 112 Souris GM : croisements avec F1 ou non-consanguine Het. B6x129 G1 B6xD2 Het. B6xD2 B6xD2 G2 G3 Le fonds génétique est : - hétérogène entre hétéros et contrôles - non défini et instable au cours des générations 113 Travailler avec des lignées co-isogéniques (KO) 129/SvJ chimère 129/SvJ Gene 1 129/SvJ Heterozygotes Homozygotes sur fonds 129/Sv 129/SvJ 129/SvJ 129/SvJ Gene 2 Gene 3 Gene n 114 Souris GM : utiliser des lignées congéniques 129/SvJ 129/SvJ 129/SvJ 129/SvJ Gene 1 Gene 2 Gene 3 Gene n C57BL/6 C57BL/6 C57BL/6 C57BL/6 Gene 1 Gene 2 Gene 3 Gene n 115 Souris GM : travailler avec hybrides F1 129S1/Sv Gene 1 C57BL/6 B6129SF1 Gene 1 Gene 1 116 Eléments de nomenclature 117 Transgènes - Définition : mutations obtenues par injection d'une séquence d'ADN exogène dans un embryon au stade une cellule. 118 Mutations ciblées - Définition : mutations obtenues par inactivation d'un gène dans des cellules ES, injection des cellules mutées dans un blastocyste receveur et implantation de l'embryon. 119 Nomenclature quizz B6;129-Acvr2tm1Zuk Une lignée de fonds mixte, dérivé de C57BL/6J et de cellules souches d’origine 129, et portant une mutation ciblée pour le gène Acvr2 STOCK Rb(16.17)5Bnr Une lignée consanguine d’origine complexe ou inconnus et portant une translocation chromosomique Robertsonienne Rb(16.17)5Bnr. C57BL/6N-Tg(CAG-RNAi:Trp53,-EGFP)1Pas Lignée transgénique sous fonds C57BL/6N, pour un RNAi ciblant le gène Trp53 et exprimant également la GFP, le tout sous contrôle du promoteur CAG, et ayant été créée à Pasteur 120 Hémizygote ou hétérozygote ? -Définition hémizygote : une seule copie du gène est présente dans le génome, ex: chromosomes sexuels et Transgénèse par insertion - Définition hétérozygote : une copie « mutée » du gène est présente sur un chromosome alors qu’une copie « sauvage » est présente sur l’autre chromosome, ex: transgénèse par recombinaison homologue Tg par insertion Hémizygote Homozygote KO ou KI Hétérozygote Homozygote 121 Contrôle de qualité génétique 122 Le contrôle de qualité génétique Contrôler que les caractéristiques génétiques d'un groupe d'animaux de laboratoire sont identiques à des valeurs de références. S'assurer de la constance des propriétés biologiques d'une colonie d'animaux de laboratoire. Effectuer des mesures génotypiques appropriées à chaque type de population à contrôler, en fonction des "dérives" qui peuvent se produire 123 Caractère biologique intégré Caractère résultant de l'interaction entre le potentiel génétique d'un individu et son environnement physique, chimique et biologique, depuis la conception de l'individu jusqu'au moment de l'analyse. 124 Variance phénotypique Variance génétique part explicable par des gènes + Variance d'environnement + Variance résiduelle Génétique part due à des paramètres analysables part due à des facteurs non contrôlés ou à des fluctuations individuelles Environnement Résiduelle 125 Types de populations Lignées consanguines Colonies non consanguines Lignées génétiquement modifiées 126 Lignées consanguines : variations Mutations Hétérozygotie résiduelle Contamination génétique 127 Lignées consanguines : mutations Modification ponctuelle du génome - Inévitables et aléatoires - Fréquence faible (10-5 - 10-6 / locus) - Détection des mutations récessives favorisée par la consanguinité 128 Lignées consanguines : mutations Effet visible immédiatement - mutation albinos sur fonds C57BL/6 - mutation de squelette, etc... Effet sur phénotype non visible - mutation Lpsd dans C3H/HeJ - gène modificateur de Min Mutations silencieuses - dans parties non codantes des gènes - les plus fréquentes 129 Lignées consanguines : mutations Fréquence A+/+ Am/m Paramètre biologique 130 Lignées consanguines : hétérozygotie résiduelle Résulte d'une consanguinité incomplète - Incontrôlable - Différente entre sous-lignées 131 Lignées consanguines : hétérozygotie résiduelle Eviter la formation de sous-lignées F31 F32 F33 132 Fréquence Lignées consanguines : hétérozygotie résiduelle F25b F18 F25a Paramètre biologique 133 Lignées consanguines : contamination Mélange entre lignées Modification massive du génome 134 Lignées consanguines : contamination - Impact génétique majeur : catastrophe - Irréversible - Toujours des conséquences biologiques graves - Détectable parfois facilement (couleur), toujours par augmentation de fertilité 135 Lignées consanguines : contamination A*B Fréquence A Paramètre biologique 136 Lignées consanguines : que contrôler ? Mutations : impossible Hétérozygotie résiduelle : trop limitée Contamination génétique 137 Marqueurs génétiques Nombreux Faciles à génotyper Polymorphes entre les lignées Stables dans le temps 138 Marqueurs de couleur de pelage DBA/2 : a/a, b/b, d/d, +c/+c Couleur Lignée pure F1 avec DBA/2 Lignée Génotype SJL/J c [+] AKR a, c [a] noire BALB/c b, c [b] marron a, b, c [a, b] marron, non agouti A/J 139 Microsatellites SSLP (simple sequence length polymorphism) - Répétitions de séquence simple - Environ 105 répétitions CA dans génome souris CTAAGCTCGAT ..CTGATTCGAGCTAGG cacacacacaca TTGCTTGACAGGT.. ..GACTAAGCTCGATCC gtgtgtgtgtgt AACGAACTGTCCA.. TGCTTGACAGG Lignée BALB/c DBA/2 Nombre de répétitions 15 21 BALB/c BALB/c F1 F1 Taille du fragment 127 139 DBA/2 DBA/2 140 Single Nucleotide Polymorphism (SNP) Polymorphisme portant sur une paire de bases - identifiés par reséquençage des génomes - 4 types possibles : C ⇔ T (ou G ⇔ A) C ⇔ A (ou G ⇔ T) C⇔G T⇔A - Présents dans les populations naturelles - Fréquence de l'allèle le plus rare >1% - Presque toujours di-alléliques - cSNP : dans un cDNA - par extension : toute variation de séquence (indel, > 1pb) 141 Single Nucleotide Polymorphism Locus 1 Locus 2 Locus 3 C57BL6 CTAGTAGGATCGGCCC DBA/2 CTAGTTGGATCGGTCC GCTATACGGGGC GCTATACGGGGC CTGTAGTCGAGGGGC CTGTAGTCGAGGGGC BALB/c CTAGTAGGATCGGCCC GCTAGCCGGGGC CTATAGTCGACGGGC CBA CTAGTAGGATCGGCCC GCTATACGGGGC CTATAGTCGACGGGC C3H CTAGTTGGATCGGTCC GCTATACGGGGC CTATAGTCGAGGGGC AKR CTAGTTGGATCGGTCC A CTAGTTGGATCGGTCC GCTAGCCGGGGC GCTAGCCGGGGC CTGTAGTCGAGGGGC CTATAGTCGACGGGC SJL CTAGTTGGATCGGTCC GCTAGCCGGGGC CTATAGTCGAGGGGC FVB CTAGTTGGATCGGTCC GCTAGCCGGGGC CTATAGTCGAGGGGC 142 SNP et phylogénie des lignées Wade et al. (2002), Nature, 420, 574-578 143 SNP et phylogénie des lignées 1638 SNP Petkov et al. (2004), Genome Research, 14, 1806-11 144 SNP et phylogénie des lignées Petkov et al. (2004), Genome Research, 14, 1806-11 145 SNP Avantages - très nombreux (plusieurs centaines de milliers décrits chez l'homme et la souris) - données massives de polymorphisme (reséquençage de lignées consanguines) - très denses : identification d'haplotypes communs - génotypage automatisable à très grande échelle (peu coûteux) Inconvénient - génotypage demande équipement spécifique coûteux pour un petit laboratoire 146 Lignées génétiquement modifiées Tester la présence de la mutation Tester l'absence de contamination du fonds génétique Tester l'absence de contamination par d'autres mutations 147 Colonies non consanguines : variations Mutations Evolution vers la consanguinité (dérive) 148 Colonies non consanguines : mutations Effet "noyé" dans le polymorphisme naturel de la colonie Mutations récessives presque jamais à l'état homozygote 149 Colonies non consanguines : consanguinité Inévitable car population de taille finie Modifie les fréquences alléliques Conduit à la perte d'allèles Effets probablement compensés 150 Colonies non consanguines : que contrôler ? Taux d'hétérogénéité génétique mesurable (fréquences alléliques de microsat.) Locus Allèles a b c d L1 0,72 0 0,28 0 L2 0 1 0 0 L3 0,2 0,43 0,17 0,2 L4 0 0,68 0,22 0,1 - Quelle variation acceptable ? 151 Colonies non consanguines : que contrôler ? Taux d'hétérogénéité génétique mesurable (fréquences alléliques de microsat.) Fluctuations très faibles ⇒ grands échantillons Tests peu sensibles Quelle valeur pour l'expérimentateur ? 152 Colonies non consanguines : que contrôler ? Contrôle phénotypique Mesurer moyenne et variance de paramètres utiles variés Contrôle des valeurs de référence de la colonie Evaluation de la dérive et l'hétérogénéité 153 Contrôle génétique : un bilan Impossible de contrôler toutes les variations La qualité génétique repose avant tout sur la conduite d'élevage La cryopréservation permet de revenir à un fonds génétique de référence (lignées consanguines) Une faible dérive génétique est inévitable et fait partie du "réactif animal" 154 La conduite d’élevage au Jackson Laboratory - Nb de générations limité en « Foundation & Expansion » - 3 types de colonies séparées - Apport régulier en production depuis stock fondateur - Renouvellement fondateurs (embryons congelés) après F5 155 Quelques conclusions… - Chaque espèce de souris résulte de la co-évolution d'allèles qui sont capables de fonctionner ensemble. Les souris de laboratoire dérivent d'hybrides artificiels entre plusieurs sous-espèces. - Les populations d'animaux de laboratoire ont des structures variées qu'il est important de bien connaître pour bien les utiliser. - Dans chaque lignée consanguine est fixée une combinaison particulière. C'est cette combinaison qui définit les caractéristiques de la lignée. Ce patrimoine génétique est en interaction permanente avec l'environnement pour déterminer le phénotype. - Un phénotype est rarement déterminé par un seul gène mais résulte d'interactions souvent complexes entre un ou quelques gènes majeurs et de nombreux gènes modificateurs. - Le contrôle de qualité génétique apporte en général peu d'information car il ne peut contrôler qu'une partie limitée de la variation génétique au cours du temps. - Les données de séquence, d'expression et de phénotype qui sont produites sur des lignées consanguines, recombinantes consanguines ou recombinantes congéniques vont permettre d'identifier des corrélations, des réseaux d'interaction et des gènes qui contrôlent des caractères complexes, par une approche in silico. 156 Combler le « fossé » biologique - Projets de mutagenèse à l’ENU - Japon (RIKEN) - Angleterre (Harwell) - Allemagne (GSF) - USA (Baylor College, McLaughlin Research Institute, NorthWestern…) - Projets de mutagenèse de cellules ES - EUCOMM : European Conditional Mouse Mutagenesis - http://www.eucomm.org/ - NIH KOMP : Knock-Out Mouse Project - http://www.komp.org/ 157 Produire de nouveaux modèles Phenotypedriven Induire des mutations aléatoires dans le génome Cribler les souris mutantes Phénotype Créer une mutation dans le gène Localiser puis identifier le(s) gène(s) muté(s) Gène(s) Genedriven Sélectionner les gènes probablement impliqués 158 Pour en savoir plus sur la souris : 159