Les éléments transposables : organisation génomique et impact évolutif Karine ALIX, AgroParisTech [email protected] Master 1 BIP Evolution et Organisation du Génome 1 Plan suivi • I. Introduction. Qu’est-ce que des séquences d’ADN répétées ? Place des éléments transposables • II. Classification, mode de transposition et organisation génomique des éléments transposables • III. Quand le génome domestique des éléments transposables • IV. Rôle des éléments transposables dans les réponses aux stress • V. Conclusion. Eléments transposables et plasticité du génome 2 I. Introduction QU’EST-CE QUE DES SÉQUENCES D’ADN RÉPÉTÉES ? PLACE DES ÉLÉMENTS TRANSPOSABLES 3 Les séquences d’ADN répétées Dénaturation d’ADN génomique et renaturation progressive; mesure du taux d’ADN non renaturé au cours du temps, en fonction de la concentration initiale C0 Unicellulaires Une seule courbe bien lisse 4 Les séquences d’ADN répétées Dénaturation d’ADN génomique et renaturation progressive; mesure du taux d’ADN non renaturé au cours du temps, en fonction de la concentration initiale C0 Unicellulaires Une seule courbe bien lisse 5 Les séquences d’ADN répétées Dénaturation d’ADN génomique et renaturation progressive; mesure du taux d’ADN non renaturé au cours du temps, en fonction de la concentration initiale C0 Unicellulaires Une seule courbe bien lisse Comme trois courbes bout à bout 6 Les séquences d’ADN répétées Dénaturation d’ADN génomique et renaturation progressive; mesure du taux d’ADN non renaturé au cours du temps, en fonction de la concentration initiale C0 Unicellulaires Un seul type d’ADN et renaturation progressive et régulière Trois types d’ADN à taux de répétition différents 7 Les séquences d’ADN répétées • ADN hautement répété /10 à 15% du génome − Peu codant, hétérochromatique (fortement condensé) − Séquences répétées en tandem = les satellites / centromériques, télomériques type TTTAGGG • ADN moyennement répété /25 à 40% du génome – Séquences répétées dispersées = les éléments transposables, avec un certain taux de diversité – Les gènes des ARN ribosomiques ARNr, de transfert ARNt (>200 copies) • ADN unique ou faiblement répété – Séquences uniques ou à faible nombre de copies = la fraction codant des protéines / au niveau de l’euchromatine, souvent 8 Rappels, le noyau eucaryote E = euchromatine, H = hétérochromatine Nu = nucléole, EN = enveloppe nucléaire Les séquences d’ADN répétées correspondent aux éléments transposables (TTTAGGG)n Schmidt and Heslop-Harrison, TPS 1998 10 Eléments transposables : la découverte • Dès 1940s : maïs / Barbara McClintock • Altération de la pigmentation de grains de maïs 1902-1992 – ET inséré dans un gène de la chaîne de biosynthèse des anthocyanes ⇒ pas de pigmentation – Expression du gène et pigmentation quand excision – Taille des tâches en fonction du moment où a eu lieu l’excision Élément mobile Pas de produit du gène gène actif Élément mobile Pigmentation 11 Eléments transposables : la découverte • Modélisation avec deux éléments : – Ds Dissociator – Ac Activator 1902-1992 Système Ac/Ds • Premières notions de l’existence d’éléments de contrôle de l’expression des gènes / prémices des mécanismes de la régulation génique Ds Pas de produit du gène • Prix nobel en 1983 Ac gène actif Pigmentation Ds 12 Eléments transposables : définition • Caractéristiques : – Fragment d’ADN mobile – Capable de se déplacer de façon autonome dans le génome • Terme « élément transposable » dans les années 70s / génétique moléculaire • Constituant majeur du génome eucaryote Arabidopsis : 15% maïs : 89% blé : >90% drosophile : 22% homme : 45% 13 II. CLASSIFICATION, MODE DE TRANSPOSITION ET ORGANISATION GÉNOMIQUE DES ÉLÉMENTS TRANSPOSABLES 14 Les différentes classes Casacuberta and Santiago, Gene 2003 15 Modèle « copier – coller » ⇒ rétrotransposons à LTR Particule de type viral Système réplicatif Sabot et al, Euphytica 2004 16 Les différentes classes Réplication par ‘copier–coller’ en passant par un ARN Casacuberta and Santiago, Gene 2003 17 Modèle « couper-coller » ⇒ transposons sens strict ⇒ MITEs transposase Système conservatif Sabot et al, Euphytica 2004 18 Les différentes classes Réplication par ‘copier–coller’ en passant par un ARN Réplication par ‘couper-coller’ en restant en ADN Casacuberta and Santiago, Gene 2003 19 Classification acceptée 20 Classification acceptée 21 Rétrovirus et rétrotransposons : une question d’évolution… 22 Les caractéristiques spécifiques des LTR Les LTR, long tandem repeats – séquences répétées en orientation directe - contiennent les régions promotrices et régulatrices des séquences codantes de l'élément et comportent trois domaines fonctionnels : U3, R et U5. Les séquences promotrices ne sont actives qu’au niveau du LTR en 5’ ; les sites de polyadénylation ne sont actifs qu’au niveau du LTR en 3’. La région R des LTR se retrouve aux deux extrémités du transcrit et est indispensable pour la transcription inverse de cet ARNm en ADNc. 23 Exercice 1 p.4 24 M.C. Serre Les transposons bactériens : IS et Tn Les séquences d’insertion IS (insertion sequence) sont des ET de petite taille (de 750 à 2500 pb) présentant une organisation très compacte ; universellement retrouvés dans le phylum procaryote. gène codant la transposase IR = répétitions inversées, 20-40 pb , reconnues par la transposase (inverted repeats) Coopération possible entre IS. Cela permet de transposer tout fragment d’ADN compris entre deux copies d’IS identiques ; on parle alors de transposon composite. 25 Exemples de séquences d’insertion (IS) : Séquence IS Occurence longueur Séquence IR bp* bp cible bp IS1 Chromosome d’E. coli (5 à 8 copies) de Salmonella (40 copies), nbx plasmides, phage P1, Tn951 768 18/23 9 IS2 Chr d’E.coli (5 copies), facteur F (1 copie), nbx plasmides 1327 32/41 5 IS50 constituant de Tn5 1534 8/9 9 IS101 plasmide pSC101 de E. coli 1209 30/36 5 * le 1er nombre représente le degré de perfection du palindrome, le 2ème sa longueur. 26 M.C. Serre Les transposons bactériens : IS et Tn Souvent, association de gènes de résistance à des antibiotiques Les transposons unitaires sont plus homogènes, sans IS, et possèdent 2 gènes : une résolvase (assurant une étape de recombinaison au site 27 res) en plus d’une transposase. M.C. Serre Les transposons bactériens : IS et Tn Les transposons conjugatifs forment une famille très homogène. Le plus petit de ces éléments, Tn916, a une taille de 18,4 kpb, ce qui classe cette famille dans les très grands ET, les plus importants pouvant atteindre 100 kpb. De 18 à 100 kpb Leurs extrémités sont formées de séquences inversées répétées de 20 à 30 pb. Entre ces bornes on trouve des gènes impliqués dans la coupure et l’échange de brins d’ADN, la conjugaison, et des marqueurs de résistance (antibiotiques par exemple). 28 « Nous apprécions maintenant la valeur adaptative que ces éléments transposables procurent aux génomes bactériens en leur permettant, entre autres, de faire face à un environnement en constante évolution. Par exemple, au cours des 50 dernières années, l’homme a rejeté, dans son environnement, diverses substances toxiques comme les métaux lourds, les antibiotiques, les pesticides ou autres substances organiques de synthèse (xénobiotiques). Ces substances ont soumis les communautés bactériennes à une forte pression de sélection pour l’acquisition de gènes de résistance. Les pesticides et autres xénobiotiques, souvent toxiques et faiblement biodégradables, ont également sélectionné des microorganismes capables de les détoxifier et même de les utiliser comme source d’énergie. Les informations génétiques responsables de la résistance aux antibiotiques ou de la dégradation des xénobiotiques sont très souvent portées par des éléments génétiques mobiles tels que plasmides conjugatifs ou transposons (certains transposons étant conjugatifs par eux-mêmes) ou parfois les deux. Cela assure la dispersion rapide d’information génétique au sein des communautés bactériennes ». D’après Les éléments transposables bactériens Christophe Merlin, Ariane Toussaint 29 « Nous apprécions maintenant la valeur adaptative que ces éléments transposables procurent aux génomes bactériens en leur permettant, entre autres, de faire face à un environnement en constante évolution. Par exemple, au cours des 50 dernières années, l’homme a rejeté, dans son environnement, diverses substances toxiques comme les métaux lourds, les antibiotiques, les pesticides ou autres substances organiques de synthèse (xénobiotiques). Ces substances ont soumis les communautés bactériennes à une forte pression de sélection pour l’acquisition de gènes de résistance. Les pesticides et autres xénobiotiques, souvent toxiques et faiblement biodégradables, ont également sélectionné des microorganismes capables de les détoxifier et même de les utiliser comme source d’énergie. Les informations génétiques responsables de la résistance aux antibiotiques ou de la dégradation des xénobiotiques sont très souvent portées par des éléments génétiques mobiles tels que plasmides conjugatifs ou transposons (certains transposons étant conjugatifs par eux-mêmes) ou parfois les deux. Cela assure la dispersion rapide d’information génétique au sein des communautés bactériennes ». D’après Les éléments transposables bactériens Christophe Merlin, Ariane Toussaint 30 Les éléments transposables sont en partie responsables de la diversité structurale des génomes, voire de leur expression 31 Les différences de taille du génome Arabidopsis pin – 23 000 Mpb 125 Mpb betterave 750 Mpb Or contenu génique équivalent… ⇒ Enrichissement différent en éléments transposables Schmidt and Heslop-Harrison, TPS 1998 32 Un exemple : Les Helitrons et la variabilité génomique du maïs Lai et al. 2005 PNAS 102: 9068-9073. 33 Variabilité haplotypique du maïs • Comparaison entre lignées de maïs, de différents locus : – Locus bz : McC // B73 – Locus z1C : B73 // BSSS53 – 3 autres régions génomiques : B73 // Mo17 • Ce qui a été observé : – Des différences dans le contenu en ETs – Des catalogues de gènes différents de nombreux gènes spécifiques sont tronqués = pseudogènes ⇒ rupture de la colinéarité génomique au sein de l’espèce • Hyopothèse de l’origine de cette rupture : ce sont des INSERTIONS COMMENT ? 34 La découverte des Helitrons - Ont été découverts par bioinformatique : Arabidopsis riz Caenorhabditis - Réplication par rolling-circle (≠ couper-coller) ADN helicase (replication) Nuclease/ligase (insertion) - Nouveau type de transposon à ADN Kapitonov and Jurka 2001 PNAS 98: 8714-8719 35 Caractéristiques des Helitrons - Insertion entre les bases A and T du génome hôte - extrêmités = 5’TC and CTRR3’ (R = A or G) - séquences de type palindrome -> hairpins côté extrêmité 3’ - pas de répétitions terminales inversées (TIRs) - pas de duplication du site cible (TSDs) 36 Analyse chez le maïs du locus bz Comparaison des lignées McC et B73 / 150 kb : - Contenu en ETs complètement différent - 4 gènes sont absents du génome de B73 Fu and Dooner 2002 PNAS 99: 9573-9578 37 McC Blast contre des données de séquences de B73 Les séquences sont identiques à 99% ! McC Blast contre des données de séquences de B73 Les séquences sont identiques à 99% ! Analyse d’un BAC de B73 39 9S McC Blast contre des données de séquences de B73 5S Analyse d’un BAC de B73 40 Du polymorphisme d’insertion au niveau du locus bz 2 insertions indépendantes AT DELETION AT AT AT Les séquences bordant l’insertion (au niveau des bases AT) sont identiques ! 41 McC Blast GSS B73 Pas d’autre ADNc identifié ADNc de B73 mais il s’agit d’un pseudogène avec des exons provenant de gènes différents Les deux Helitrons ne contiennent que des fragments de gènes = pseudogènes 42 Evolution du génome du maïs • Helitrons et insertions / des phénomènes récents • ≠ évoluƟon du génome du maïs à parƟr d’un génome tétraploïde pour revenir à un génome diploïde, impliquant de nombreuses délétions et pertes de gènes • Les Helitrons permettent le mouvement de gènes au sein du génome du maïs ; il s’agit d’un mécanisme généralisé 20% des 21 000 gènes du maïs ont des positions différentes entre B73 et Mo17 du fait de l’activité d’Helitrons Morgante et al. 2005 Nat Genet 37: 997-1002. 43 D’un point de vue fonctionnel… • Certains Helitrons qui portent des fragments de gènes sont exprimés / transcription d’un ARN ⇒ La fonction du gène peut-être affectée : – ARN interférence – Ou même traduction d’une nouvelle protéine • Les Helitrons contribuent à – La variabilité haplotypique du génome du maïs – Potentiellement, aux différences d’expression des gènes entre lignées de maïs Buckler et al. 2006 Curr Op Plant Biology 44 III. QUAND LE GÉNOME DOMESTIQUE LES ÉLÉMENTS TRANSPOSABLES 45 De l’ADN poubelle à l’ADN domestiqué « L’accumulation des ET, qui peut être très importante dans certains génomes, suggère que de nombreuses insertions d’ET peuvent être neutres et constitue un des arguments en faveur de l’hypothèse de l’ADN « poubelle » (= junk DNA) pour expliquer l’abondance de l’ADN non-codant chez les eucaryotes » (KIDWELL & LISCH 2000). De nombreuses insertions d’ETs sont éliminées par sélection car elles induisent des effets délétères. Et parfois, des insertions sont avantageuses et ont été sélectionnées : on parle de domestication des ET. 46 Les télomères chez la Drosophile HeT-A, TART, et TAHRE, qui seraient d’anciens rétrotransposons, jouent le rôle de télomères chez D. melanogaster • Maintien de l’intégrité des télomères vital pour − réplication cellulaire − Intégrité du génome • Quelques dizaines de kb ou plus de séquences dites télomériques aux extrémités des chromosomes /TTAGGG chez l’Homme ; TTTAGGG chez Arabidopsis ; TTAGG chez différents insectes mais pas chez Drosophila + activité d’une télomérase absente chez Drosophila • D’anciens rétrotransposons sans LTR = LINEs auraient été domestiqués pour constituer les extrémités protectrices des chromosomes chez D. melanogaster (génome séquencé) • N’ont jamais été trouvés ailleurs dans le génome ! Pardue and DeBaryshe PNAS, 2011 47 Le système immunitaire des mammifères Les protéines RAG1 et RAG2 seraient d’anciens ETs « domestiqués » pour la formation des gènes d’anticorps, par recombinaison • Recombinase VDJ impliquée dans la fabrication des récepteurs des cellules T de l’immunité diversité de ces récepteurs (ciblés contre la diversité des antigènes) liée à la recombinaison somatique, impliquant des cassures dans l’ADN • Deux sous-unités de cette recombinase = RAG1, RAG2, responsables des clivages de l’ADN, avec mécanisme identique à une transposase • Origine : capture par transfert horizontal d’un ancien transposon à ADN avec TIRs, de la superfamille des Transib, il y a 500 millions d’années (Kapitonov & Koonin, 2015) 48 V(D)J recombination occurs in the primary lymphoid organs (bone marrow for B cells and thymus for T cells) and in a nearly random fashion rearranges variable (V), joining (J), and in some cases, diversity (D) gene segments. 49 https://laikaspoetnik.wordpress.com/tag/vdj-recombination/ La mise en place du placenta chez les mammifères Rétrovirus et transposons à l’origine de la mise en place et de la diversification du placenta chez les mammifères • Le placenta peut-être défini comme le tissu à l’interface des tissus maternels et fœtaux Organe le plus diversifié (forme, type cellulaire,…) chez les mammifères • A l’origine : une infection par un rétrovirus aurait abouti à son intégration dans le génome et au recrutement de ses régulateurs d’expression génique /mise en place du premier placenta • Etapes d’évolution ultérieure : MER20, un transposon de classe II, est à l’origine de la régulation de l’expression des gènes localisés dans la paroi utérine 50 /reprogrammation fonctionnelle spécifique au niveau du placenta Le déterminisme sexuel du melon L’insertion d’un transposon est responsable de la transition de fleurs mâles à fleurs femelles chez le melon PI 124112 × Gynadou Identification du locus G et de la forme g, impliqué dans la transition fleur mâle -> fleur femelle 51 Le déterminisme sexuel du melon Gynadou AAgg x AAGG PI 124112 1,4 kb pour le locus G de PI 124112 1,4 kb + insertion transposon hAT pour le locus g de Gynadou + _ Corrélation locus g et présence du transposon 52 Le déterminisme sexuel du melon Gynadou AAgg x AAGG PI 124112 1,4 kb pour le locus G de PI 124112 1,4 kb + insertion transposon hAT pour le locus g de Gynadou Inhibition de l’expression par méthylation + _ Corrélation locus g et présence du transposon Mécanisme : Il s’agit d’un contrôle épigénétique de l’expression de l’ORF3 causé par le transposon; quand il y a insertion du transposon, il y 53 a méthylation et non expression de l’ORF3. IV. RÔLE DES ÉLÉMENTS TRANSPOSABLES DANS LES RÉPONSES AUX STRESS 54 Condensation de la chromatine Degré de condensation de la chromatine / modifications chimiques des histones et de l’ADN = acétylation – phosphorylation – ubiquitinylation - méthylation 55 Impact du degré de méthylation • Si modification chimique des histones et de l’ADN par méthylation : – Modification du degré de condensation de la chromatine – Modification de l’activité transcriptionnelle des gènes présents ⇒ Modification épigénétique ! • Modification héritable au niveau de l’expression du génome sans changement de la séquence nucléotidique de l’ADN 56 Une hétérochromatine méthylée • méthylation = pas ou peu de transcription ! • La méthylation est nécessaire à la stabilité du génome • Analyse de mutants où absence de méthylation Souris : mort Végétaux : phénotypes très perturbés ex : mutant ddm1 chez Arabidopsis Miura et al, Nature 2001 57 Une hétérochromatine méthylée • Mutant ddm1 d’Arabidopsis thaliana / absence de méthylation ⇒ Forte activité des éléments transposables ! – Transposition d’un transposon de classe II, type CACTA (Miura et al, Nature 2001) – De même pour transposon de type Mutator (Singer et al, Genes Dev 2001) • Maïs et transposition du transposon Spm quand déméthylation du promoteur (Fedoroff et al, BioEssays 1995) 58 Une hétérochromatine méthylée • Le silencing des éléments transposables, une question de survie pour l’espèce hôte ! • Les éléments transposables sont source de mutations – Recombinaison illégitime entre éléments dispersés / aberrations chromosomiques, génomiques – Transposition possible dans des gènes vitaux / knock-out de gène vitaux ⇒ Accumulation des éléments transposables dans les régions hyper-condensées et hyper-méthylées de l’hétérochromatine 59 L’hétérochromatine • Lieu d’accumulation des éléments transposables • Majoritairement constituée de séquences d’ADN répétées non codantes • Caractéristiques : – Compaction importante – ADN fortement méthylé – Faible activité transcriptionnelle • Par opposition à l’euchromatine, qui contient l’ensemble des gènes • Centromères / Télomères / Certains chromosomes Voir cours de Caroline Hartmann 60 Réponse du génome au stress état normal Stress éléments transposables non actifs « silencés » par hétérochromatinisation = condensation et méthylation de l’ADN ? changements dans le degré de méthylation de l’ADN état stressé éléments transposables actifs déméthylation et décondensation de l’ADN ⇒ transcription possible ! 61 Attaque de pathogènes • Rétrotransposon de type copia Tnt1 / les Solanacées – 5,3 kb – 500-600 copies Question : Tnt1 peut-il être activé par l’attaque d’un pathogène ? • Activation d’un rétrotransposon – Vérifier si le rétrotransposon est transcrit – Est-elle accompagnée de transposition ? 62 Attaque de pathogènes • Suivi de l’expression du promoteur de Tnt1A blessure – Construction LTR-GUS Gène reporter Gus sous contrôle du promoteur LTR – Transformation de plants de tomates Grandbastien, Trends in Plant Sci 1998 inoculation 63 Attaque de pathogènes • Recherche de nouvelles insertions de Tnt1A après application d’extraits fongiques – Plants de tabac régénérés à partir de protoplastes et d’explants (témoins) – Technique S-SAP (Sequence -Specific Amplification Polymorphism) http://www-ijpb.versailles.inra.fr/fr/bc/equipes/Transposons/ 64 Attaque de pathogènes • De nouvelles bandes S-SAP « apparaissent » – 25 % des plantes régénérées à partir de protoplastes – 2,7 % des plantes régénérées à partir d’explants - témoins méthode de régénération / culture tissulaire extraits fongiques / attaque de la paroi cellulosique Melayah et al, Plant J 2001 65 Attaque de pathogènes • Conclusions – Activité transcriptionnelle de Tnt1A – Suivie de transposition – En réponse à • une blessure • une inoculation par un champignon • l’application d’extraits fongiques • L’attaque de pathogènes induit l’activation de Tnt1A 66 Attaque de pathogènes région U3 : des analogies avec les régions régulatrices des gènes de défense Polymorphisme de la région U3 = spécificité de réponse au stress 67 Casacuberta and Santiago, Gene 2003 Attaque de pathogènes • D’autres cas répertoriés : – Tto5 (tabac) – virus de la mosaïque du tabac – Bs1 (maïs) – virus de la mosaïque de l’orge ⇒ Implication des éléments transposables dans les mécanismes de défense des végétaux 68 Exercice 2 p.7 à 9 69 V. Conclusion ELÉMENTS TRANSPOSABLES ET PLASTICITÉ DU GÉNOME 70 Des éléments ubiquitaires et généralement réprimés • Les éléments transposables se retrouvent chez tous les organismes vivants • Les éléments transposables sont des éléments à fort pouvoir mutagène • Ils sont parfois en très grand nombre de copies dans le génome • Ils sont maintenus dans le génome MAIS soumis à une répression de leur activité transcriptionnelle 71 Une valeur adaptative certaine • Les éléments transposables sont source de variabilité génétique • Et présentent une importante valeur adaptative – Mécanismes de défense aux stress biotiques – Mécanimes d’adaptation aux stress abiotiques • Des mutations peuvent être bénéfiques et sélectionnées par le génome hôte 72 La plasticité du génome Génome statique, figé Génome plastique, dynamique - Structure - Fonction • Impact important des éléments transposables sur la diversité génomique • Importance des mécanismes épigénétiques – méthylation, ARN interférence,… / domaine en pleine investigation 73 La course au séquençage du génome des espèces d’intérêt (ici végétales) Possible par l’innovation technologique et le développement des approches NGS cours de Bénédicte Sturbois MAIS, comment atteindre la fraction correspondant à l’ensemble des éléments transposables ? Problème dans l’assemblage de la séquence au niveau de ces régions répétées. Vitte et al. 2014 Il ne nous reste qu’à continuer à fouiller dans la « poubelle » des sorties des séquenceurs… 74 Merci 75 Diapos supplémentaires 76 Rétrotransposons Télomériques de D. melanogaster et D. Virilis (>40 millions d’années depuis leur séparation) Mary-Lou Pardue, and P. G. DeBaryshe PNAS 2011;108:20317-20324 77 ©2011 by National Academy of Sciences Modèle du déterminisme sexuel chez le melon GG aa gg AA gg aa Idem si AA car action inhibitrice de GG sur l’expression du locus A 78