LES MARQUEURS MOLECULAIRES Il y a différents types de marqueurs : o Les caractères phénotypiques : limités, observations sur l’arbre entier et sur différentes années o Les marqueurs biochimiques o Les marqueurs moléculaires ADN, indépendants du tissu et du milieu INTERET DES MARQUEURS MOLECULAIRES • Une importante variabilité - ou polymorphisme –génétique (présence de multiples allèles pour de nombreux gènes) existe au sein des espèces. • L’analyse peut se faire sur des gènes ou sur des séquences non géniques. • Tout fragment d’ADN caractéristique (donc variable) d’un génome à l’autre pourra être utilisé comme marqueur moléculaire. L’ensemble du génome peut donc être utilisé. Régions géniques = 2introns + exons =5% Elément transposable (transposon) : séquence d'ADN capable de se déplacer et de se multiplier de manière autonome dans un génome, par un mécanisme de transposition. Même si l’on observe la même espèce, ces gènes ne se retrouveront donc pas au même endroit sur le génome (ex : TN10, résistance à la tétracycline chez la bactérie ou la séquence Alu chez l’Homme.) QUELQUES REMARQUES Par rapport au polymorphisme protéique : un polymorphisme dans les régions non codantes de l’ADN est moins soumis à la sélection naturelle. Le polymorphisme de l’ADN n’entraîne pas nécessairement des effets décelables sur le développement ou le phénotype en général. I- PRINCIPALES SEQUENCES REPETEES LINE = Long INterspered Element SINE = Short INterspered Element (ex: séquence Alu) Les rétrovirus-like ressemblent à des rétrovirus et contiennent des séquences gag, pol et env entre deux LTR (=longues répétitions terminales). On peut penser à une trace d’infection récente. Les rétrovirus-like non autonomes sont une trace d’infection rétrovirale encore plus vieille car ils ne contiennent que gag. Les transposons fossiles sont les équivalents de très vieux transposons bactériens. RETROINSERTION ET METHYLATION DES LINES ET SINES - La présence des Lines et Sines au sein de clusters les rend relativement inoffensifs car ils ne s’insèrent que très rarement dans les séquences codantes (1 maladie génétique sur 600 environ) -Selon certains généticiens, cette organisation en clusters, en favorisant des recombinaisons entre différentes parties du génome a eu un rôle important dans l’évolution. En plus de leur aspect parasite, ces éléments auraient pu être sélectionnés par l’évolution. GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 1 - Il existe un contrôle de l’hôte sur le taux de transcription des Lines et des Sines, par l’hyperméthylation des promoteurs. Cependant, il y a eu au cours de l’évolution des bursts de retroinsertion de ces séquences. - Lorsque les cellules ont une baisse de la méthylation des promoteurs (stress, prolifération rapide), on peut avoir dérégulation des promoteurs de ces éléments ce qui va conduire à des vagues de rétroinsertion et contribuer à créer de l’instabilité génétique, notamment dans les cellules somatiques. Cela pourrait expliquer en partie la forte instabilité génétique des cellules cancéreuses. MICRO/MINI-SATELLITES Microsatellites : répétitions de 1, 2 ou 3 nucléotides. On peut les retrouver des dizaines de fois côte à côte. Ex : -répétition de CA : 10 à 60, 50 000 -répétition de A : 10 à 50, 500 000 -répétition triplet CAG : C’est le plus fréquent, cela confère une instabilité du génome. Il y a une très grande majorité de CAG dans les régions codantes (phase codante de certains gènes : 10 à 100>> maladie neurodégénérative de Huntington.) Minisatellites : répétitions de 10 à 30 nucléotides répétés de 10 à 300 fois. Chaque minisatellite diffère par sa localisation, très grande variabilité d’un individu à l’autre>>empreinte génétique. (On l’utilise en criminologie et recherche de paternité) REMARQUES Certaines répétitions de séquence ont des rôles importants. Les télomères par exemple ont un rôle fonctionnel (duplications géniques dans grandes séquences répétés par recombinaison homologue). /!\ TOUS LES POLYMORPHISMES NE SONT PAS DES MUTATIONS. Une mutation peut être = à marqueur moléculaire, mais elles sont très peu utilisées comme telles. Les marqueurs moléculaires servent à faire des cartes génétiques, de la taxonomie et de la phylogénie. /!\ Carte génétique ≠ Carte physique Exemple, utilisation de marqueur STS pour cartographier un plasmide : Les YAC et les BAC sont des plasmides artificiels. Afin de faire une cartographie, on suppose donc que le génome est circulaire et que chaque YAC/BAC contient la totalité du génome. Si deux YAC/BAC possèdent le même marqueur alors les deux fragments d’ADN se chevauchent STS1 STS2 STS3 YAC A + + YAC B + + YAC C + + II- METHODES BASEES SUR LES POLYMORPHISMES I NDIVIDUELS SEQUENCAGE : caractérisation des différentes paires de bases. 1. RFLP : RESTRICTION FRAGMENT LENGTH POLYMORPHISM (1980) Un polymorphisme peut supprimer ou créer un site de restriction. Digestion de l’ADN génomique par enzyme de restriction, s’il y a du polymorphisme dans un site de restriction, les profils enzymatiques des individus testés ne seront pas les mêmes. Les fragments sont ensuite hybridés dans une expérience de Southern Blot avec une sonde marquée capable de révéler un fragment d’ADN dont la taille est modifiée. La technique RFLP est définit par le couple ER-sonde. GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 2 2. AFLP : AMPLIFICATION FRAGMENT LENGTH POLYMORPHISM (1995) PRINCIPE : Amplification de fragments par PCR si la séquence entre les amorces n’a pas été digérée. METHODE : - Digestion enzymatique - Ajout de linkers (au bout de chaque fragment) d’ADN avec sites pour primers - Amplifications PCR à l’aide d’amorces complémentaires des linkers + 2 ou 3 nucléotides en plus. - L’amplification ne peut se faire que si l’amorce contient le/les nucléotides de + (ici le G) - Visualisation sur gel Défaut = il peut y avoir des bandes parasites et la technique PCR n’est pas complètement reproductible. /!\ Seules les bandes intenses et reproductibles sont prises en compte 3. AUTRES METHODES SCAR : Utilisation de PCR on part du gel, on le découpe puis on le met dans des tubes PCR. On isole le marqueur spécifique que l’on peut ensuite amplifier de façon plus précise par PCR. SSCP = les ADN simple brin (linéaires) qui ne diffèrent que de quelques nucléotides n’ont pas la même conformation 3D. Il faut avoir une dénaturation suffisante pour interdire le rappariement intermoléculaire (entre les brins), mais autoriser les recombinaisons intramoléculaire pour permettre à l’ADN de garder sa forme. On sépare ensuite les fragments par PCR. DDGE= création de petite région parfaitement appariées (homoduplexe) qui migrent différemment des petites régions non parfaitement appariées (hétéroduplexe) car elles varient d’un nucléotide. Ensuite, la séparation des fragments se fait par PCR. Indel= insertion/délétion par PCR SNP= détection de polymorphisme au nucléotide près. On joue sur les conditions de stringences. 1SNP/300bases pour population 1SNP/1000bases pour 2 individus III- METHODES BASEES SUR LA VARIABILITE DES SEQUENCES REPETEES 1. RAPD: RANDOM AMPLIFIED POLYMORPHIC DNA (1990) Principe du RAPD : Amplification d’ADN au hasard Utilisation en PCR d’un primer aléatoire unique court (une dizaine de nucléotides) pouvant hybrider à plusieurs endroits. Amplifications aléatoires de régions d’ADN qui peuvent différer selon les génotypes des individus, si une région polymorphe est amplifiée. Les amorces pourront se mettre face à face (pouvant ainsi amplifier) ou non. Mise en évidence du polymorphisme entre 2 individus par la présence d’une bande en plus sur la gel s’il n’y a pas eu d’amplification. Défauts = les mêmes défauts que AFLP. 2. MICROSATELLITES : SEQUENCES REPETEES EN TANDEM (1992) SSR : Analyse des microsatellites par PCR. Utilisation d’une paire d’amorces (2 X 20 nucléotides) spécifiques de part et d’autre du microsatellite dont la taille diffère entre deux individus. Ex : si l’on trouve une bande de 54pb pour l’individu A et de 70 pb pour l’individu B, on peut conclure que la taille du microsatellite est de 7 nucléotides pour A et 15 pour B (car répétition de CA par exemple, donc X2) UTILISATION DES MARQUEURS • Génétique Moléculaire: clonage de gènes, diagnostic, dépistage, empreinte génétique…. • Biologie des populations: estimation de la variabilité inter et intra espèces, phylogénie, analyse des fréquences alléliques… GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 3 LE MODELE « SOURIS » - Hypothèse d’une mutation récessive à l’origine d’une pathologie sur un chromosome donné. - Analyse de la ségrégation de la pathologie avec les chromosomes: - souris fond génétique « pur » différent chez le mutant et l’animal sain 25% descendants atteints de la maladie. La mutation « ségrége » avec le fond génétique « bleu ». On est pas plus avancés, mais… Si on n’a pas ¼, ¼, ¼, ¼ c’est qu’il y a une distorsion recombinaison : liaison génétique. Analyse de 30 marqueurs microsatellites répartis sur le chromosome identifié : La mutation est « liée » aux marqueurs polymorphes communs : 3,4,13,14,21 ou 24 Analyse des nouveaux croisements jusqu’à obtenir une liaison génétique systématique: Identification du marqueur 24. /!\ Ce ne sont pas le nombre de répétitions qui indiquent si l’individu est malade ou pas. On regarde le marqueur ( ici le nombre de répétitions) et non pas un allèle. Ce marqueur est ASSOCIE (mais pas =) à la maladie. CAS DE PATHOLOGIES LIEES A L’X – DIAGNOSTIC / Lorsque la maladie est dominante et liée au chromosome X : - Les femmes sont plus souvent atteintes - Les fils d'un homme atteint d'une anomalie dominante liée à l'X ne sont jamais atteints (les garçons reçoivent forcément le X de la mère et le Y du père); ses filles par contre le seront bien. - Une femme atteinte d'une anomalie dominante liée à l'X aura à chaque grossesse 50 % de risques d'avoir une fille ou un fils atteint. Lorsque la maladie est récessive et liée au chromosome X : - Les hommes sont plus souvent atteints - Les fils d'un homme atteint d'une anomalie récessive liée à l'X ne sont jamais atteints; ses filles par contre porteront une seule copie du gène mutant. - Une femme atteinte d'une anomalie récessive liée à l'X aura à chaque grossesse 50 % de risques d'avoir un fils atteint et 50 % de risques d'avoir une fille porteuse d'une seule copie du gène mutant. Ici, la maladie est dominante puisqu'elle ne saute pas de générations. Elle est portée par X puisqu'un père malade donne que toutes ces filles soient malades. GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 4 CAS DE PATHOLOGIES AUTOSOMALES DOMINANTES OU RECESSIVES Lorsque la maladie est dominante, il y a au moins 1 individu malade par génération. Dans ces deux cas, il n’y a pas eu de crossing-over. Lorsqu’il y a des CO entre les deux allèles cela signifie qu’il y a une distance suffisante pour que l’échange se fasse : on n’utilise pas ce marqueur s’il est trop loin de la mutation. EXEMPLE Dans cette famille chaque chromosome parental est distinct des autres. On peut déterminer sans ambiguïté le génotype de chacun, sachant que le sujet malade est homozygote pour un allèle muté (a1/a1). COMPARAISON RFLP/ MI CROSATELLITES AIDEZ-MOI A COMPRENDRE !! GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 5 Exemple : analyse de 4 régions α : 4 microsatellites β : 2 microsatellites δ : 4 microsatellites γ : 4 microsatellites Lorsqu’il y a le même nombre de répétitions sur les deux allèles (homozygote) et que l’individu n’est pas malade, ce n’est pas un microsatellite suspect. Les individus 2 et 3 possèdent les mêmes microsatellites sur les régions α et β. Ce ne sont donc pas des régions suspectes car l’individu 2 est malade mais pas le 3. Les individus 1 et 4 possèdent les mêmes microsatellites sur la région δ. Celle-ci non plus n’est pas suspecte. En ce qui concerne la région γ, les deux malades semblent avoir hérité de l’allèle 1 de la mère. Pourquoi la mère n’est GEMM : Les Marqueurs Moléculaires (Vidal 2010-2011) Page 6