Plan du cours 2005-2006 de génétique Pr F. SOUBRIER 6 H Polymorphismes et diversité génétique Marqueurs génétiques: le génotype Ouvrages consultables : Strachan : génétique moléculaire L’haplotype humaine Thompson : génétique La recombinaison méïotique Delpech et Kaplan : Biol mol et med La liaison génétique Etienne et Clauser Cartographie physique et génétique Feingold et Fellous Notions de génétique somatique : réarrangement, mutations Lois de Mendel-transmission autosomique dominante, récessive autosomique, liée à l’X-pathologie mitochondriale Polymorphisme génétique Toute variation de séquence génomique entraînant l’existence d’au moins 2 formes différentes de la séquence dans la population Types de polymorphisme Substitution d'un nucléotide (SNP) Insertion/délétion Polymorphisme de répétition (VNTR, CA repeat…) Exemples de Single Nucleotide Polymorphisms : SNP Génération de la variabilité génétique Mutation (substitution, addition /soustraction d'un ou plusieurs nucléotides) … AAGTCGAT… … AAGCCGAT… … ATGCCT… … ATGCTCCT… Recombinaison Crossing-over (échange de matériel génétique équilibré entre 2 portions homologues de chromosomes) Chr paternel CCATCGA CCATGAC X Chr maternel AACAGAC AACACGA Conversion : se réalise dans un segment d’ADN double-hélice où se forme un hétéroduplex. Réalise un transfert non réciproque d’information génétique car un allèle « convertit » l’autre. Peut résulter de la recombinaison entre séquences alléliques, Conversion génique : transfert non réciproque d’information génétique entre 2 gènes ayant une homologie élevée Diversité de séquence des gènes humains Diversité nucléotidique p : Nombre de différences, rapporté à la longueur de la séquence examinée, entre 2 séquences prises au hasard dans la population (ex: p = 4 x 10-4, 1 différence en moyenne toutes les 2500 bp) AGTCCTA…………..GGAAACTG…………TTTACGT…. AGTGCTA…………..GGTAACTG…………TTGACGT…. 7500 bp p = 3/7500 = 1/2500 Diversité de séquence des gènes humains _______________________________________________________________ Nb Nb Pop Codant Syn Non gènes SNPs syn _______________________________________________________________ Halushka (1999) 75 726 Non codant Européens 4.5 9.0 3.1 5.4 Africains 6.3 12.9 4.2 6.8 Cargill (1999) 106 560 Européens 5.6 9.8 3.7 4.9 Onishi (2000) 41 187 Japonais 2.4 1.2 1.2 4.3 Tiret (2001) 50 228 Européens 3.0 5.6 2.3 4.3 ___________________________________________________________________________ Mutations des séquences non codantes plus fréquentes que sur les séquences codantes Dans séquences codantes :silencieuses plus fréquentes que non silencieuses Notion de marqueurs en génétique : Le génotype •Le marqueur génétique sert à repérer ou identifier un chromosome ou un allèle transmis • Définissent le génotype (constitution génétique d’un individu) qui inclut les allèles d’un seul locus où de l’ensemble des locus, selon les cas • Marqueurs génotypiques : • variations identifiables et connues de la séquence du génome • de localisation connue • d’informativité connue • codominants : les 2 allèles sont détectables chez les hétérozygotes Marqueurs génétiques 2 • est caractérisé par des allèles correspondant à chaque variation possible de la séquence • degré d’hétérozygotie d’un marqueur H=1 – (Spi2) • Fonction du nombre et de la fréquence de chacun des allèles • Exemple : 3 allèles de fréquence 0,2 / 0,3 / 0,5 Hétérozygotie est de 1- (0,04+0,09 + 0,25) = 0,62 2 allèles de fréquence 0,2 / 0,8 : 1- (0,04 + 0,64)= 0,32 Un marqueur biallèlique ne pourra pas avoir une hétérozygotie supérieure à 0,5 qui sera atteinte en cas d’allèles de fréquence égale. Les différentes types de marqueurs : SNP : single nucleotide polymorphism = substitution simple de nucleotide VNTR = variable number of tandem repeats (nombre variable de répétitions en tandem) regroupent les ministallites et les microsatellites Minisatellite : répétitions en tandem de motifs de 11 à 16 paires de base en moyenne, parfois plus longs. : répétitives, disséminées (à l’exception des chromosomes X et Y), : hyperpolymorphes : hétérozygotie élevée Exemples de Single Nucleotide Polymorphisms : SNP VNTR : variable number of tandem repeat Répétitions en tandem d’unité élémentaire Microsatellite Mononucléotide Dinucléotide Tri ou tetra nucléotide Minisatellite 12-15 nucléotide Variation du nombre n de répétitions Mise en évidence - Par PCR - Par hybridation avec sondes Minisatellites : taille variable de la répétition - Explorés par technique de southern - sonde monolocus spécifique d’un VNTR donné - sonde multilocus : séquence commune à différents minisatellites dans le génome : image complexe - hétérozygotie supérieure à 90 % Minisatellites associés à certaines maladies - Diabète : minisatellite en 5’ du gène de l’insuline - tr du comportement VNTR 48 bp du DRD4 Minisatellite : Hybridation avec une sonde multilocus Les microsatellites - Répétition de motifs de 1 à 4 nucléotides - Le plus fréquent et le plus utilisé : dinucléotide (CA)/(GT) : réparti sur tout le génome, très informatif. - méthode de génotypage : amplification et séquençage du produit de PCR - Hétérozygosité souvent supérieure à 70% - permet de rechercher l’instabilité des microsatellites dans les tumeurs : caractère acquis (somatique) dû à une anomalie du sytème de réparation des mésappariements de l’ADN - Exemple BAT25, BAT26, BAT40 : mononucléotide Séquence d’un microsatellite Instabilité Multiplexage Perte d’allèles SNP (RFLP) VNTR (Minisat) Variable Number of Tandem Repeats STR (Microsat) Short Tandem Repeats de substitution de répétition de répétition > 10 nucléotides 1 à 5 nucléotides Biallélique Multiallélique Multiallélique Informativité + +++ +++ Détection Southern PCR (hybridation, RFLP) PCR Southern PCR uniquement Polymorphisme Marqueur génétique Empreinte Génétique Profil génétique très spécifique d’un individu obtenu grace à une combinaison de marqueurs de type VNTR tres informatifs, principalement les minisatellites, ou en associant plusieurs microsatellites. Intérêt en médecine légale Nécessite de l’ADN en qualité et en quantité suffisante au moins pour l’amplification par PCR. Définition de l’haplotype Un haplotype est constitué par plusieurs génotypes , c’est à dire une succession d’allèles sur plusieurs marqueurs identifiés sur le même chromosome (en cis) et dont on connaît l’ordre • Suppose de connaître la localisation précise de chaque marqueur • Suppose de connaître la phase, c’est à dire le chromosome sur lequel se situe les allèles de chaque génotype La détermination de l’ordre des marqueurs sur un haplotype se fait • Par cartographie physique : placement des marqueurs au sein d’un segment de chromosome dont on connaît la séquence (depuis 2002) • séquençage de grands fragments chevauchants et placement des marqueurs sur le chromosome • Par cartographie génétique en examinant ces marqueurs dans plusieurs meïoses dans des études familiales Les haplotypes ne sont pas toujours conservés d’une génération à l’autre. On peut observer dans la descendance : - Les haplotypes parentaux - Haplotypes recombinés dus à recombinaison méiotique Fig. 1. Linkage of PHAII to the telomere of 12p in K22. (A) The structure of PHAII kindred K22. Affected, unaffected, and deceased individuals of unknown phenotype are shown as filled, unfilled, and shaded symbols, respectively. Genotypes at loci from the telomeric segment of chromosome 12p are shown in their chromosomal order with the telomere at the top; estimated genetic distances between adjacent loci (in cM) are shown. The boxed haplotype cosegregates with the disease. Two independent recombination events in affected individuals define the location of the disease gene to the most telomeric 2-cM segment. In addition, four loci within this segment demonstrate hemizygosity in affected kindred members; the inferred null alleles are denoted as "0." Genotypes that unambiguously demonstrate absence of transmission of an allele from affected parent to affected offspring are indicated by asterisks. (B) Multipoint lod score for linkage of PHAII to 12p in K22. The map of marker loci used in the multipoint analysis is shown at the top of the figure, and the 1000:1 support interval for the PHAIIC locus is indicated by the thick bar. Exemples d’haplotypes La méiose : triple finalité Elle assure - La transmission de l’information génétique d’une génération à la suivante - La réduction du nombre de chromosomes de 2n (diploïde) à n (haploïde) . La reconstitution de 2n se fait lors de la fécondation - Elle assure le brassage de l’information génétique qui aboutit à la diversité des individus de la même espèce Le brassage de l’information génétique Deux mécanismes lors de la première division méiotique -Par le mécanisme de la ségrégation au hasard lors de l’anaphase de la 1ère division méiotique : - n paires de Chr homologues : 2 n = le Nombre de combinaisons chromosomiques possibles par la répartition au hasard des chr. - Chez l’homme n=23 donc 223 = 8,4 x 106 types de gamètes différents - Par la recombinaison génétique - crossing-over impliquant la cassure des doubles hélices paternelles et maternelles sur des points homologues Les recombinaisons méiotiques -Ont lieu lors de la prophase de la première division méiotique, au stade pachytène. - Chaque paire de chr homologue est appariée - Chaque chr est dupliqué et formé de 2 chromatides sœurs (chaque chromatide est formée d’une double hélice) - Constituent une tétrade - Recombinaison génétique : les 4 chromatides peuvent être impliquées dans les échanges - Au stade diplotène, les chromatides non sœurs sont reliés par les chiasmas traduisant sur le plan cytogénétique le crossing-over La recombinaison homologue – mécanismes généraux 1 Recombinaison générale : entre 2 régions homologues mais pas identiques -Soit lors d’une cassure accidentielle de l’ADN -Soit lors de la Méiose Modèle de Holliday : cassure simple-brin symétrique Pas forcément le bon modèle mais distingue les étapes : - Molécules de DNA appariées - Formations de brèche sur la séquence d’ADN - Invasion du brin - Ligation et migration de la jointure recombinante - Résolution : recombinaison ou non recombinaison Liaison Génétique 1 Si 2 marqueurs sur 2 chromosomes différents : transmission indépendante des allèles Si 2 marqueurs proches sur le même chromosome allèles tendent à être transmis ensemble et non de façon indépendante : liaison génétique Conséquences : les allèles de marqueurs situés sur des loci génétiquement liés auront tendance à être transmis dans la même combinaison que chez les parents : conservation des haplotypes parentaux Méiose réassortis Liaison Génétique 2 Les échanges dus au crossing-over sont strictement réciproques La fréquence de recombinaison dépend de la localisation relative des deux gènes sur le chromosome : plus l’intervalle qui sépare les 2 gènes est grand, plus grande est la probabilité pour qu’un crossing-over s’effectue dans cet intervalle. La fréquence de recombinaison q est une mesure de la distance génétique entre les 2 gènes L’unité génétique est le centimorgan cM Liaison Génétique 3 Additivité des distances Soit 3 gènes liés A, B, C. Par croisement on observe le bombre de recombinants entre les 3 gènes. On obtient les distances entre chaque couple de gènes : distance additive La fréquence des remaniements sur l’intervalle total est égale à la somme des fréquences des remaniements sur les deux intervalles adjacents définis par les locus des 3 gènes 1 seul ordre possible Limitation de l’additivité : les doubles crossing-over Sous-estimation des distances car plusieurs crossing-over intéressent la même chromatide, d’autant plus grande que la distance est grande La répulsion : 1 chiasma (crossing-over) éloigne la survenue du suivant Recombinaisons haplotypiques Crossing-over et double crossing-over Notions de distance physique et de distance génétique II Distance Génétique déduite des recombinaisons observées entre 2 marqueurs polymorphes : exprimée en Morgan En supposant que dans un intervalle donné les recombinaisons sont indépendantes les unes des autres , il existe une relation entre fréquence de recombinaison distance génétique d, exprimée en cM : q et 1 cM ~1MB Il est possible d’ordonner des locus expérimentalement par l’observation des haplotypes recombinants, car les combinaisons issues de 2 évènements de recombinaison sont plus rares que celles provenant d’un seul évènement Taille du génome humain en distance génétique Chiasmas lors de la méiose chez le sujet masculin : 49 en moyenne aboutissant à 50% de recombinants Longueur génétique totale : 2450 cM (plutot 2644cM) Méioses femelles : plus de chiasmas : taille 4481 cM En moyenne - 1 cM équivaut à 1,13 Mb chez l’homme et 0,67 Mb chez la femme. Les 2 sexes confondus : 1cM=0,9 Mb. Fréquence des recombinaisons entre 2 locus fonction de la distance qui les sépare ab ab AB AB AB ab ab ab AB ab ab ab Ab ab ab aB Les 2 locus sont liés 10+8 77+88+10+8 X100 ~9% distance génétique =9cM Notions de distance physique et de distance génétique I Distance physique mesurée par les méthodes physiques de mesure de taille de fragments d’ADN clonés dans des vecteurs : • Méthodes d’analyse : Electrophorèse, southern, champ pulsé pour les fragments supérieurs à 50 kb • Fragments clonés: hybrides d’irradiation, YAC, BAC, plasmides : • Notion de contig : chevauchement de fragments clonés, première étape pour le séquençage d’un génome Principe des contigs et des STS ancrés Conséquences génomiques de la recombinaison méiotique -Le brassage génétique : modification des assortiments d’allèles en cis - La recombinaison entre allèles peut se traduire par leur modification par conversion génique au sein d’un hétéroduplex - L’augmentation du nombre de copies de gènes répétés lors d’une recombinaison inégale - L’élimination d’un gène défectueux dans les familles de gènes répétés. - Evènements rares et pathologiques : lésions de l’ADN dues à la recombinaison : délétions, insertions, remaniements chromosomiques (changement dans la régulation, ou dans la structure) Applications des outils de la génétique moléculaire I Analyse de liaison génétique : But : mettre en évidence une liaison génétique entre un marqueur génétique (de localisation connue) et le locus de la maladie (inconnu) Type d’études : familiales Marqueur : très informatif : microsatellite Type d’analyse : analyse paramétrique avec modèle de la maladie Liaison testée par méthode de vraisemblance : Lodscore : logarithme ratio vraisemblance hypothèse de liaison sur non liaison. Principes de la recherche d’une liaison génétique entre un locus morbide autosomique dominant et 2 locus définis par un SNP Applications des outils de la génétique moléculaire II Etudes d’association génétique Comparaison de fréquence allélique pour un marqueur entre un groupe témoin et un groupe de cas Non paramétrique (pas de modèle) : tests statistiques : chi2. On teste le déséquilibre de liaison entre marqueur (connu) et allèle de susceptibilité (inconnu mais très proche) Peu puissant Nécessite de grands échantillons Marqueurs utilisés : SNP Etudes d’association : comparaison de 2 groupes 1 groupe témoin et 1 groupe patients atteints Génétique somatique Concerne les évènements génétiques postérieurs à la formation du zygote, donc restreints à une sous-population cellulaire de l’organisme Exemples : Modification artificielle du génome cellulaire par fusion : hybride somatique (outil de laboratoire) Réarrangement des gènes des immunoglobulines Mutation somatique : perte d’allèle, inactivation ou activation de gènes Réarrangement des gènes des immunoglobulines Système génétique devant permettre la synthèse d’au moins plusieurs millions de molécules différentes qui forment les immunoglobulines Partie constante (invariable), et une partie variable qui reconnaît l’antigène (épitope ou motif de l’antigène) Ig : parties constantes différentes et variables identiques : switch des IgM aux IgG Mémoire pour la réactivation de la synthèse d’immunoglobulines Un seul type d’anticorps par cellule : exclusion allèlique malgré 2 chromosomes Le modèle des chaînes légères kappa Gènes sur le chromosome 2 Nécessitent 1/Gène V (variable=300), 2/gène J (jonction=5), 3/ gène C (constant=1) Séquence leader devant chaque gène V codant pour le peptide signal permettant la secrétion La formation d’un gène kappa fonctionnel pendant la maturation du lymphocyte pre-B résulte d’une recombinaison entre l’extrêmité 3’ d’un gène V et un gène J: disparition de quelques centaines de Kb : réarrangement. Persistance d’un intron de 2 à 3 kb : épissé lors de la maturation du mRNA La recombinaison s’effectue grâce au complexe heptamère-nonamère par RAG-1 et RGA-2 Structure d’une immunoglobuline : chaîne lourde et légère Réarrangement somatique des gènes de chaîne légère d’immunoglobuline Pathologie de l’ADN 1 MACROLESIONS Les recombinaisons entraînent Délétion ou Duplication de grande taille (100 bp à qq millions de bp) - Lors d’une recombinaison homologue crossing-over méiotique inégal - ou à un échange entre 2 chromatides sœurs Favorisée par la présence de séquences répétées - ou lors d’une recombinaison non homologue Translocations entraînent des fusions en orientation directe ou inversée (cassure et déplacement d’un Chr vers un autre Chr) Conversion génique : correction d’un brin de DNA par son partenaire dans un hétéroduplex non parfaitement complémentaire. Entre séquences alléliques ou consécutives Mismatch sur l’hétéroduplex Conversion génique par correction d’hétéroduplex Recombinaison inégale Contiguité de gènes très semblables : recombinaison inégale ou conversion génique Pathologie de l’ADN 2 LESIONS A L’ECHELLE NUCLEOTIDIQUE Petites délétions : 1 à 10 paires de base - dépurination - dérapage réplicatif : polymorphisme des microsatellites Substitutions - Désamination d’une cytosine méthylée : Cytosine en Uracile - Erreur de réplication ou de réparation DIFFERENTS TYPES DE MUTATIONS . PONCTUELLES: - mutations silencieuses - mutations conservatrices - mutations faux sens A Transition C T Transversion G . AVEC DECALAGE DU CADRE DE LECTURE insertion ou délétion AUG GCC UCU AAC CAU GGC Met Ala Ser Asn His Gly . INSTABLES AUG CUC UAA Met Leu STOP Pathologie de l’ADN 3 Lésions intermédiaires Délétion exonique : taille variable QQ dizaines à QQ centaines de paires de base Expansions de triplets riches en GC : mutations dynamiques mécanisme à l’origine de nombreuses maladies génétique - X fragile, maladie de Steinert, Huntington, - Expansion à partir d’une taille limite Maladies liées à l’expansion d’une répétition de trinucléotides Atrophie musculaire spinobulbaire (maladie de kennedy) Synrome de l ’X fragile (FRAXA et FRAXE) Dystrophie myotonique (maladie de Steinert) Chorée de Huntington Ataxie spinocerebelleuse de type I Atrophie dentatorubrale et pallidoluysienne Dystrophie myotonique de Steinert Myopathie héréditaire de l ’adulte la plus fréquente : 1/8000 Signes musculaires, signes cardiaques, cataracte, calvitie Expressivité variable + phénomène d’anticipation (aggravation de génération en génération) Forme adulte et forme congénitale : hypotonie néonatale 98% des cas : Due à expansion de triplets (CTG)n dans région 3 ’ non traduite de DM protéine kinase Taille normale : 5 à 35 CTG 50 à 100 : signes minimes formes congénitales : > 500 répétitions Autre gène : locus ZNF9 : expansion CCTG Maladie de Steinert de type 1: Expansion de CTG (de 38 à >100) dans région 3 ’ non traduite du dernier exon Perturbation de l ’expression de DMWD et de SIX 5 (chromatine) : arrythmies et cataractes Toxicité de RNA DMPK : Dystrophie Myotonique (liaison RNA-BP) Perturbation du processing du messager DMPK Conséquences des mutations sur le fonctionnement du gène - Délétion plus ou moins complète du gène - Expression et régulation du gène - Epissage du gène - Altération de la phase de lecture : troncature par codon stop prématuré - Codon stop, mutation du codon stop, codon initiateur - Codon faux-sens : interaction, adressage, fonction catalytique, modification post-traductionnelle Grands types d’anomalies fonctionnelles des gènes Gain de fonction Perte de fonction Dominant Dominant Gène surnuméraire Haplo-insuffisance Gène toxique Dominant négatif Gène activé (oncogène, récepteur) Récessif Perte de fonction Maladies liées à l’expansion d’une répétition de trinucléotides Atrophie musculaire spinobulbaire (maladie de kennedy) Synrome de l ’X fragile (FRAXA et FRAXE) Dystrophie myotonique (maladie de Steinert) Chorée de Huntington Ataxie spinocerebelleuse de type I Atrophie dentatorubrale et pallidoluysienne Dystrophie myotonique de Steinert Myopathie héréditaire de l ’adulte la plus fréquente : 1/8000 Signes musculaires, signes cardiaques, cataracte, calvitie Expressivité variable + phénomène d’anticipation (aggravation de génération en génération) Forme adulte et forme congénitale : hypotonie néonatale 98% des cas : Due à expansion de triplets (CTG)n dans région 3 ’ non traduite de DM protéine kinase Taille normale : 5 à 35 CTG 50 à 100 : signes minimes formes congénitales : > 500 répétitions Autre gène : locus ZNF9 : expansion CCTG Minisatellite avec sonde P1 et coupure par enzyme de restriction et southern blot. Exemples de tumeurs traitées ou non par l’acide ocaidique. RECHERCHE DE MUTATIONS Gène Régions flanquantes 5' ATG -100 -70 -30 1 Régions flanquantes 3' STOP AATAAA polyadénylation Protéine allongée Faux-sens, Non sens, Isosémantique, Délétion, Insertion Epissage: absence, sites 5' ou 3' alternatifs Anomalie de l'initiation de la traduction Modification quantitative de l'expression