UEx – Parcours Génétique Cours n°3 29/10/2015 Caroline Nava [email protected] RT : SABRI Sophia RL : Maladies génétiques liées à des réarrangements génomiques Plan : I. Classification des anomalies chromosomiques II. Mécanismes de survenue des anomalies chromosomiques A. NAHR non allelic homologuous recombination B. NHEJ (non homologous end joining) C. FoSTeS (Fork Stalling and Template Switching) III. Méthodes d’exploration du génome A. Le caryotype B. La FISH C. Les puces à ADN IV. A. B. C. D. V. Réarrangements génomiques et pathologies humaines CNV récurrents CNV non récurrents Pathologies A/R Applications en recherche Séquençage de nouvelle génération appliqué à la recherche des réarrangements chromosomiques I. Classification des anomalies K La classification se fait selon : 1. le lieu et le temps de survenue : on peut avoir soit des anomalies constitutionnelles (présentes dans toutes les Cl de l’organisme) qui mènent à l’existence d’une « maladie génétique » qui sera transmissible à la descendance SOIT des anomalies acquises (au cours des mitoses) appelées anomalies somatiques (pas présentes dans toutes les Cl de l’individu). 2. le mécanisme : cela peut être des anomalies de nombre (trisomie, monosomie), des anomalies de structure (délétion, duplication, inversion, translocation, isochromosomes, K en anneaux avec perte des télomères et fusion des K). Les délétions et duplications sont appelés des CNV ou Copy Number Variant (à retenir). 3. la conséquence : anomalies déséquilibrées (trisomie, monosomie, délétion, duplication), ou anomalies équilibrées (pas de perte ou de gain du matériel génétique) avec les translocations ou les inversions. Ces réarrangements chromosomiques peuvent avoir plusieurs conséquences : 1. Délétion d’un ou plusieurs gènes entraînant une haploinsuffisance 2. Duplication d’un ou plusieurs gènes entraînant souvent une surexpression de celui-ci 3. Délétion causant l’apparition d’un gène de fusion (cancer) 4. Un souci au niveau du point de cassure entraînant pathologie et haploinsuffisance Des conséquences phénotypiques communes peuvent être retrouvés entre les différentes grandes anomalies déséquilibrées des autosomes (tous les K sont concernés sauf les K sexuels) => atteinte cognitive, syndrome malformatif, anomalie de la croissance. Pour les anomalies touchant les gonosomes (les K sexuels), on peut observer une stérilité, une insuffisance gonadique (exemple dans le syndrome de Turner) si anomalie de nombre. Par contre, on observera les mêmes conséquences phénotypiques chez les garçons présentant une anomalie de structure sur ses K sexuels que chez les personnes présentant une anomalie déséquilibrée des autosomes. Pour ce qui est des grandes anomalies équilibrées cette fois, le PT sera généralement normal mais il y aura un risque de déséquilibre chez la descendance. II. Mécanisme de formation de ces réarrangements génomiques A. NAHR (non allelic homologuous recombination) Il s’agit d’une recombinaison entre régions répétées. On a ici des hots spots de réarrangements principalement au niveau des LCR ou Low Copy Repeat, qui sont des séquences présentant plus de 95% de ressemblance. Ces réarrangements au niveau des LCR vont donner lieu à des anomalies récurrentes, c’est-à-dire des anomalies retrouvées chez de nombreux patients pour une pathologie donnée, il y a donc récurrence, ce qui s’oppose à des cas isolés. (Savoir distinguer anomalie récurrente d’une anomalie non récurrente). Exemple de pathologies où l’on peut voir ce genre de mécanisme : neurofibromatose de type 1 B. NHEJ (non homologous end joining) Il s’agit ici d’un mécanisme de réparation de l’ADN lors d’une cassure double brin entre deux séquences non homologues. Le problème retrouvé lors de cette réparation est une perte de matériel car il y a fusion des deux extrémités avec modification éventuelle et très souvent une délétion. C’est un mécanisme de réparation non conservatif car la séquence initiale de l’ADN ne sera pas conservée. On retrouvera dans le cas de NHEJ des anomalies non récurrentes. C. FoSTeS (Fork Stalling and Template Switching) On retrouve ce mécanisme pendant la réplication de l’ADN. Il fait intervenir des sites de microhomologie. Le mécanisme de FoSTeS est différent de la recombinaison homologue nonallélique (NAHR) et de la jonction d’extrémités non homologues (NHEJ) parce qu’il s’agit d’une voie basée sur la réplication qui ne nécessite pas forcément la survenue d’une cassure double brin. (Mécanisme peu détaillé). III. Méthodes d’exploration du génome Pour étudier la séquence de l’ADN on va plutôt parler de génétique moléculaire, tandis que pour étudier le chromosome, on parlera de génétique chromosomique ou cytogénétique. Pour explorer le génome, on bénéficie de plusieurs techniques : le caryotype, la FISH, les puces à ADN ainsi que le séquençage de nouvelle génération. A. Le caryotype Son intérêt: pangénomique (tout le génome est observé en une seule fois), observable au microscope mais PEU précis (résolution 5-10 MB) Les micro réarrangements ne sont PAS visibles avec un caryotype car ils font moins de 5 MB. B. La FISH Le problème de la FISH est qu’il faut que ce soit ciblé. C’est une méthode non pangénomique, il faut être orienté et savoir « où chercher ». Son principe : on dispose d’une sonde ADN complémentaire d’une séquence ADN marquée à la fluorescence, puis dénaturée avec séparation du double brin, puis hybridation des sondes complémentaires à l’ADN (sondes spécifiques à locus donné). Son intérêt : BIEN pour des réarrangements récurrents. La résolution est d’environ 200 KB C. Puces à ADN Leur intérêt : pangénomique ET bonne résolution (la résolution dépend du nombre de sondes, souvent autour d’une dizaine de KB). Leur principe : on procède à une analyse K sur puces à ADN (ACPA). Miniaturisation ++. Le but sera de comparer les différences entre de l’ADN du patient et de l’ADN témoin. Il existe deux méthodes: CGH Array et puces à ADN de type SNP. CGH Array: l’ADN témoin et l’ADN patient sont marqués à l’aide de deux couleurs différentes. Exemple : l’ADN patient est rouge et l’ADN témoin est vert. On hybride l’ADN avec des oligonucléotides présents sur la puce. L’analyse des données consiste à regarder les couleurs pour chaque point de la puce. *Si c’est normal, on aura un point de couleur jaune car il y a autant d’ADN patient que d’ADN témoin (deux copies). *Si on a qu’une seule copie, on obtient un point de couleur verte, car délétion et donc moins d’ADN patient. *Si on a plusieurs copies sur l’ADN patient, avec des duplications, la sonde du patient s’hybridera préférentiellement aux oligonucléotides, on obtiendra un point de couleur rouge. Puces à ADN de type SNP : On a ici seulement le patient, pas d’ADN témoin. L’ADN est dénaturé, amplifié, fragmenté, redénaturé puis hybridé sur la puce. Sur la puce: oligonucléotide qui va s’arrêter pile au moment du polymorphisme avec ajout d’une seule base à chaque fois. Permet de savoir si l’individu est homozygote ou hétérozygote pour un allèle donné. C’est un principe différent de la CGH Array car on a dans l’exploitation des résultats, la présence du B allèle fréquency. Si on a une délétion, on observera une baisse de l’intensité de ce signal avec perte du signal hétérozygote. Inversement, s’il y a duplication, on aura une augmentation du signal et apparition de 4 GT possibles. Le défaut des puces à ADNP de type SNP: ne détecte PAS les anomalies équilibrées (exemple translocation équilibrée, toutes les anomalies où il n’y a pas de perte de matériel génétique). IV. Réarrangements génomiques et pathologies humaines On peut dénombrer deux grands types de microarrangements : Les arrangements récurrents avec syndromes connus Les arrangements non récurrents (cas isolés) A. CNV récurrents Exemples: Syndromes de Di George, Charcot Marie Tooth, Angelman Maladie de Charcot Marie Tooth ou neuropathie sensitivomotrice héréditaire : La duplication de cette région donne une pathologie et la délétion en regard (exactement dans la même région que la duplication de la maladie de Charcot) donne d’autres symptômes. Signes cliniques : Faiblesse progressive des Mb inférieurs, scoliose, pieds creux, perte de sensibilité distale, réflexes diminués ou absents. Un certain type de cette maladie (parmi cinq grands types trouvés): CMT1A (présentant une démyélinisation de l’axone des neurones). Duplication du gène PMP22: transmission autosomique dominante à pénétrance Incomplète (certains individus peuvent porter la duplication sans être forcément malade). Le gène PMP22 code pour une protéine de structure de la myéline des nerfs périphériques. 70% des patients ont une duplication de 1,5 MB en 17p112. Neuropathie héréditaire avec hypersensibilité à la pression: pathologie présentant une délétion dans la même région que la maladie de Charcot (où on a duplication). Signes cliniques : épisodes transitoires, fréquents après traumatisme léger ou compression. Récupération en plusieurs jours/semaines. Déficit moteur résiduel dans 10% des cas avec vitesse de conduction anormale à l’EMG. Epaississement de la myéline (contrairement à la maladie de Charcot où on observe une démyélinisation). Transmission autosomique dominante à pénétrance incomplète avec délétion de la même région que celle de la maladie de Charcot. Dans les deux cas, la délétion/duplication de PMP22 est due à une recombinaison inégale entre des régions de haute homologie. Syndrome de Di George (microdel 22q11) 1 enfant sur 4000 de novo dans 90% des cas Variabilité du PT. Les signes cliniques sont : dysmorphie faciale discrète (alignement avec extrémité de l’oeil, narine, coin de la lèvre), fente palatine, troubles de l’apprentissage, troubles psychiatriques, malformations viscérales (au niveau du thymus, des glandes parathyroïdes, cardiopathie cono troncale). Situé sur gène TDX1. Plusieurs régions d’homologie, délétions récurrentes (petites ou grandes) Syndrome de Smith Magenis (del17p11) Signes cliniques : dysmorphie, petite taille, doigts et orteils courts, difficultés d’apprentissage, déficit intellectuel, troubles du comportement, hyperactivité, agressivité, troubles du sommeil. Délétion vue à la FISH. Gène RAI1 responsable de la majorité des signes cliniques. Syndrome de William (7q11) 1 enfant sur 10 000 atteint dysmorphie en visage d’elfe (car il y a plus d’élastine, la peau est donc plus souple) et cardiopathie caractéristiques (sténose aortique), retard du développement intellectuel, retard de langage, hypersensibilité émotive, anxiété, fascination pour les jeux de lumières, comportement social et amical, hypercalcémie. Délétion 7q11 vue à la FISH. Syndromes dûs à des régions soumises à empreinte : 15q11-q13 région soumise à empreinte. Cela signifie que les gènes au niveau de cette région sont exprimés soit à partir du K du père soit à partir du K de la mère, et pas les deux K des deux parents à la fois. Syndrome d’Angelman : avec comme signes cliniques un déficit mental, une microcéphalie, un aspect joyeux, une ataxie, des crises d’épilepsie. Ce syndrome est lié à une délétion de gènes du K maternel. Inversement, le syndrome de Prader Willi, avec comme signes cliniques une hypotonie, un retard de langage, des difficultés alimentaires dans la petite enfance, un retard d’apprentissage, un hypogonadisme, une hyperphagie entraînant un surpoids, avec délétion de cette même région 15q11-q13, mais transmise par le père. Question : Pourquoi observe-t-on d’avantage de microdélétions que de microduplications ? Hypothèses 1. Les microduplications ne sont pas viables, létales donc non vues? 2. Les microduplicatins ne sont pas pathologiques, donc on observe pas de PT, donc non vues non plus? 3. Le PT est très variable, donc pas de caractéristiques communes entre les différents patients, donc PT plus difficile à reconnaître? Une réponse possible serait que les conséquences des microduplications sont plus modestes que les microdélétions. La pénétrance serait souvent incomplète et le Pt d’expression variable. Les microduplications sont beaucoup plus souvent héritées et moins « de novo » que les délétions (70% des microduplications de 1 à 10 MB sont héritées). Il faut être prudent cependant dans l’interprétation des résultats car l’expressivité est certainement variable. Syndrome de Potocki Lupski (duplication de 17p11.2 comme Syndrome Smith Magenis dont il est le syndrome réciproque) Signes cliniques : une hypotonie, un retard de développement, des difficultés alimentaires, une déficience intellectuelle, un retard de langage Duplication au niveau de la région 7q11.23, syndrome réciproque de Willliams. Grande variabilité clinique décrite dans des articles. Duplication 15q11-q13: le PT est variable, il dépend de l’origine parentale (duplication paternelle héritée moins sévère que si la duplication vient du côté maternel). On observe tout de même quelques signes cliniques constants :déficience intellectuelle, troubles autistiques, épilepsie. Les duplications sont plus difficiles à distinguer dans la clinique, que certaines délétions causant des syndromes connus avec des signes cliniques caractéristiques. Souvent, dans les duplicatins, les éléments dysmorphiques ou malformation sont mineurs voire absents. C’est pour cela que les puces à ADN sont très importantes car pangénomiques. B. CNV non récurrents On se trouve ici dans le cas de syndrome de gène contigu ou gène critique. 1) Comment distinguer le CNV pathogène du CNV bénin ? Question : chaque individu possède des CNVs, mais comment déterminer le caractère causal d’un CNV, et comment différencier le réarrangement pathogène du polymorphisme ? En quoi les êtres humains diffèrent-ils? Car il existe des SNP (pas forcément pathogène), qui sont des variations dans la séquence entre les personnes. On retourne un SNP tous les 300 nucléotides, ce qui nous donne donc 0,1% du génome différent entre les individus ! Autre source de diversité: CNV (de plus de 1 KB), qui peut concerner 12% du génome (400MB). Pathogène ou bénin? On va se poser plusieurs questions pour définir du caractère pathogène ou bénin d’une modification de séquence. La localisation du CNV (dans une séquence codante, inter génique, intronique) Analyse des parents et étude de la ségrégation avec la maladie (l’apparition du CNV de novo chez l’enfant est un argument fort pour penser que c’est pathogène) Délétions plus souvent pathogène que les duplications La taille du CNV Le CNV est-il connu chez des patients ou pas? On pourra se référer à une base de données. Exemple de base de données : DGV (CNV chez des personnes témoins) ou DECIPHER (base de données trouvées chez des patients). Quelques problèmes s’imposent au chercheur qui essaie de déterminer le caractère d’un CNV : la majorité des réarrangements sont privés (dans des familles) il existe des facteurs de prédisposition (on pourra retrouver ce CNV chez des témoins même si ce CNV prédispose à la maladie). CNV facteurs de susceptibilité: confèrent un risque de pathologie mais pas suffisant à eux seuls. Ex de la délétion 16p11.2: il s’agit d’un CNV récurrent, associé à l’autisme, la DI, l’obésité; ce CNV peut être transmis par un parent asymptomatique et retrouvé chez des personnes contrôles en minorité. Donc c’est un facteur de risque, mais il faut une association à une ou plusieurs mutations ou même à des facteurs non génétiques pour être pathogène. gènes récessifs (il faudra avoir deux fois la copie de ce CNV pathogène pour avoir un PT) quels critères pour déterminer ce qu’est qu’un individu témoin/contrôle ? 2) Les micro réarrangements non récurrents sont une cause importante de DI et d’autisme La DI est caractérisée par : un QI<70 1 à 3% de la population limitation significative des capacités mentales avec un impact sur le fonctionnement .. ? touche beaucoup plus les hommes Les troubles du spectre autistique (ou autisme): Signes cliniques sont une altération des interactions sociales, des comportements répétitifs et stéréotypés, des intérêts restreints, un déficit de la communication, une comorbidité présente: l’épilepsie début avant l’âge de 3 ans Quatre fois plus d’hommes touchés que de femmes Pour aider au diagnostic il faut faire une CGH Array ou une puce à ADN de type SNP. Comment analyser ces puces à ADN? Le CNV est-il bénin ou pathogène? Première chose: le CNV est-il répertorié chez des témoins, si pathogène, il faut étudier les parents. Si CNV de novo, on retiendra que c’est la cause de DI. Si le CNV est hérité, il faudra se demander si le parent en question est déficient léger ou si c’est un facteur de prédisposition. Seconde chose : il faut voir ensuite si ça touche la séquence codante et que c’est bien inconnu dans la base de donnée témoins. De même qu’au dessus, si de novo: pathogène. Si transmis: bénin. C. Microarragements dans pathologies autosomiques récessives Exemple de délétion homozygote avec des parents consanguins, un enfant autiste testé. On retrouve une présence de régions homozygotes au B allèle fréquency du fait de la consanguinité de ses parents. L’enfant n’a reçu qu’une seule version du gène ou de la région du gène. Il est donc homozygote à cette région. Exemple de délétion hétérozygote associé à un variant « en trans » (sur l’autre copie). Après PCRq (quantitative), le père de l’enfant avait une délétion, et la mère avait une mutation STOP pour la même région. L’enfant a reçu la mutation stop et la délétion. On a donc une délétion hétérozygote avec en plus une autre version sur la deuxième copie. Cas particulier du syndrome de TAR: syndrome avec thrombocytopénie avec aplasie radiale. C’est un syndrome à pénétrance incomplète de la délétion 1q21.1 (tous les patients avaient cette délétion toujours héritée d’un parent). Rien dans les séquences non codantes, mais on remarque chez l’enfant atteinte la présence de polymorphismes en 5’ par rapport à la séquence de leurs parents sains. Dans ce syndrome, il faut donc l’association d’une délétion ET d’un SNP en 5’ du gène récurrent non codant. D. Applications en recherche : microarrangements non récurrents associé à des pathologies connues Syndrome de Dravet ou épilepsie myoclonique du nourrisson est une pathologie connue avec certains signes cliniques caractéristiques. Signes cliniques de ce syndrome sont un développement normal mais une arrivée de crises d’épilepsie fébriles unilatérales avant l’âge de 1 an avec états de mal post crises cas généralement isolés (sporadiques) rares cas familiaux Gène SCN1A (touche un canal sodique voltage dépendant) avec mutation de novo, dans 90% des cas Mutations ponctuelles dans 90% des cas (non traitées dans le cours), et 10% des cas des réarrangements dans le gène (sujet du cours) On procède à la recherche de nouveaux gènes dans le syndrome de Dravet: recherche de microarrangements autres que ceux connus, car il existe des patients présentant ce syndrome en l’absence des microarrangements récurrents (donc connus). Identification d’un patient hémizygote mâle avec une délétion Xq22.1 (autre que les microarrangements connus) Délétion confirmée avec d’autres patientes Mais toujours des filles atteintes (à part pour le premier patient identifié) : soit mutation de novo soit mutation transmise par le père. Suspicion d’un modèle inhabituelle de transmission liée à l’X. En effet, il s’agit d’un modèle inverse de la transmission liée à l’X, les filles hétérozygotes étaient atteintes et les hommes homozygotes ne l’étaient pas. Mécanisme d’interférence cellulaire du fait de l’existence chez les filles mutées de deux types de neurones (neurones mutés et sains). Même effet que les filles hétérozygotes mutées chez les garçons en mosaïque avec donc coexistence des deux types de neurones. Syndrome CHARGE (Colobome -anomalie au niveau des yeux-, Heart disease, Atrésie des choanes, Retard mental, genital Hypoplasia, Ear anomalies ) : identification du gène causal grâce à une corrélation GT/PT: délétion 1p36 avec des patients présentant des SC plus ou moins constants entre eux. Découpage de la région en question: si disparition de telle région => épilepsie, autre région => autre SC. Permet d’affiner la recherche de la délétion en question pour chaque malade. V. Séquençage de nouvelle génération appliquée à l’étude des réarrangements chromosomiques Le principe du séquençage de nouvelle génération est un séquençage en parallèle d’un grand nombre de fragments dans un même milieu de réaction (de quelques dizaines à plusieurs centaines de paires de bases), avec notion de profondeur de séquençage (combien de reads/lectures?). Méthode du « whole exome » avec préparation de librairies, capture des exons, séquençage de ces exons, puis analyse bioinformatique. On obtient une identification des points de cassures à la base près, ce qui rend ce séquençage idéal car précis, mais coûteux. Son intérêt : détection des mutations ponctuelles (à la base près donc) Une des techniques est une recherche de CNV sur les exons : moins cher mais moins précis car détecte seulement les anomalies déséquilibrées. Analyse des CNV: compte le nombre de reads (lectures) et comparaison entre patient et contrôle. Permet le DPN (diagnostic pré natal non invasif) qui permet d’effectuer un diagnostic d’anomalie chromosomique sur une prise de sang de la mère enceinte par exemple pour la trisomie 21 (car on peut détecter la présence d’ADN foetal circulant dans le sang maternel, qui représente 5% de l’ADN présent dans ce sang. Le problème subsistant est l’impossibilité de trier l’ADN foetal de l’ADN maternel). Cette technique de DPN non invasive permet d’éviter un trop grand nombre d’amniocentèses et de biopsies, qui comporte un risque de fausses couches non négligeable (contrairement à la prise de sang). Technique de paired end : permet de détecter les anomalies déséquilibrées ET équilibrées mais c’est une technique plus complexe. Les fragments sont séquencés avec un adaptateur à chaque extrémité, ce qui permet la comparaison entre la taille attendue entre les deux adaptateurs et la taille détectée au séquençage. CONCLUSION (Take Home Messages) Les réarrangements génomiques sont la cause importante de maladies génétiques surtout dans les DI. Les réarrangements récurrents proviennent de recombinaison non homologue entre les duplications segmentaires: peut générer délétions et duplications en miroir (avec des syndromes complètement différents selon que l’on a une délétion ou une duplication en regard de la même région). Les microréarrangements emportant plusieurs exons d’un gène peuvent entraîner des maladies génétiques liées à un gène (gène critique), ces CNV doivent être recherchés par des méthodes appropriées. De nombreux CNV sont retrouvés dans la population normale et participent possiblement à la susceptibilité de maladies communes. C’est l’avènement du séquençage de nouvelle génération avec application en diagnostic, mais existence de ce fait de beaucoup de données qu’il faut savoir traiter et analyser. Abréviations : CNV Copy Number Variant K chromosomique Cl cellule PT phenotype GT genotype LCR Low Copy Repeat KB kilobase MB mégabase SNP Single Nucleotide Polymorphism A/R autosomique/recessive Mb membres DI déficit intellectuel Mot du RT FICHE RECAPITULATIVE Blabla blabla c’est très important Et ne pas oublier blabla !