Clonage dans un plasmide (pUC) • Réplication indépendante de celle du chromosome bactérien (ori) • Sélection des bactéries transformées (plasmide avec ou sans insert): ampR • Site multiple de clonage au niveau d'une portion du gène de la β-galactosidase E. coli (LacZ'). • Sélection des bactéries transformées (plasmide avec insert): crible blanc/bleu en présence d'IPTG et de X-gal. • Capacité de clonage: 3 - 4 kb Cycles du bactériophage λ (phage tempéré) Cycle lytique Cycle lysogénique Injection de l'ADN du phage dans la bactérie Réplication de l'ADN Synthèse des protéines de la capside Assemblage des particules phagiques Lyse bactérienne Intégration de l'ADN du phage dans le chromosome bactérien (prophage) Réplication en même temps que le chromosome bactérien Induction Stimulus externe Excision du prophage Génome du phage λ Génome λ: ADN bicaténaire de 48,5 kb Gènes essentiels au déroulement du cycle lysogénique → 25% du génome cosR cosL Gènes essentiels au déroulement du cycle lytique (synthèse ADN, assemblage des particules phagiques, lyse) → 60% du génome Structures du génome • Molécule linéaire dans les particules phagiques • Circularisation au niveau des extrémités cos (segments d'ADN simple brin complémentaires) dans les bactéries infectées par le phage Construction du vecteur de clonage BamH1 cosR cosL λ de type sauvage Délétion des gènes non essentiels au déroulement du cycle lytique Gène de sélection (ex: lacZ) cosL Fragment de substitution Vecteur de clonage λ (≅45 kb) cosR Insertion d'un fragment de substitution (≅ 15 kb) cosR cosL ADN exogène Délétion du fragment de substitution Insertion de l'ADN exogène Contrainte liée à l'assemblage de particules phagiques infectieuses La taille de la molécule d'ADN doit être comprise entre 38 et 51 kb Clonage de fragments d'ADN exogène de tailles comprises entre 9 et 22 kb (T4 DNA ligase) cosR cosR Procédure de clonage dans le phage λ Clonage dans un cosmide Gène de résistance à la tétracycline (tet R) 4-6 kb Sélection des bactéries contenant un cosmide recombinant Sites cos Site de clonage (Bgl II) Origine de réplication (ori) Cosmide: site cos du phage λ + plasmide → Clonage de fragment de 45 kb maximum (capacité λ ×3) Sites cos λ → Encapsidation in vitro → Particules virales capables d'infecter E. coli (efficacité > transformation) Origine de réplication plasmidique → Multiplication dans la bactérie de la même façon qu'un plasmide Procédure de clonage dans un cosmide Dephosphorylate (alkaline phosphatase) (T4 DNA ligase) Individualisation et stockage des clones recombinants Vecteurs PAC (P1-derived artificial chromosome) LoxP Bactériophage P1 Phage tempéré; hôte E. coli Taille du génome: 115 kb Capacité de clonage des vecteurs PAC : 75-95 kb Structure du vecteur ori: origine de réplication plasmidique kanR: gène de résistance à la kanamicyne P1 plasmid replicon ScaI pBR322 ori pac pAD 10sacBII (30 kb) LoxP sacB Kan R P1 lytic replicon BamHI Pac ("packaging site"): le clivage de ce site permet l'assemblage des particules virales LoxP: sites de recombinaison du phage P1 "P1 plasmid replicon": réplication et maintient d'une seule copie par bactérie "P1 lytic replicon": gènes sous le contrôle du promoteur lac. Induction de par l'IPTG → l'amplification du nombre de copies du vecteur recombinant sacB: gène de saccharose synthase; crible de sélection des bactéries recombinantes; site de clonage (BamH1). La dégradation du saccharose produit un composé hautement toxique pour les bactéries. Sur un milieu contenant du saccharose, seules les bactéries dont le gène sacB est modifié se développeront. Empaquetage in vitro Digestion du vecteur BamHI + ScaI 1. Digestion partielle d'ADN exogène de haut poids moléculaire 2. Sélection des fragments de 70-95 kb Individualisation et stockage des clones Sélection des colonies contenant un PAC recombinant Milieu sélectif saccharose + kanamycine Ligature → concaténaires Clivage des sites pac (pacase) Circularisation P1 plasmid P1 lytic replicon replicon Infection E. coli (cre+) Recombinase Gène cre Vecteurs BAC (Bacterial artificial chromosome) lacZ' Taille maximale des inserts 300-350 kb, le plus souvent 100-150 kb Facteur F (fertilité) E. coli → plasmide impliqué dans la conjugaison bactérienne. → Intégration au chromosome bactérien réversible → Excision du chromosome en même temps qu'une portion du génome bactérien (× 10100 kb → 4,6 Mb) Structure des vecteurs BAC oriS: origine de réplication repE: réplication du plasmide à partie de oriS; maintient du nombre de copies à 1-2 par cellule parA, parB: stabilité du plasmide; incompatibilité avec d'autres facteurs F (parB) CMR: gène de résistance au chloramphénicol Site de clonage dans le gène lacZ': crible de sélection blanc/bleu lacZ' 7 kb 1. Digestion du vecteur (HindIII) 2. Déphosphorylation (phophatase alcaline) Ligature T4 DNA ligase CMR 1. ADN de haut poids moléculaire partiellement digéré (HindIII) 2. Sélection des fragments de taille > 150 kb (Electrophorèse en champ pulsé) Transformation E. coli par électroporation 1 colonie bactérienne renfermant 1 BAC recombinant Stockage des clones (plaques de microtitration) Étalement des bactéries sur un milieu contenant du chloramphénicol, de l'IPTG et de l'X-gal Sélection des colonies blanches Vecteurs YAC (Yeast artificial chromosome) Cellules hôtes Vecteur sans insert, circulaire → E. coli → ori; agent de sélection: AmpR Vecteur avec insert, YAC → S. cerevisiae → ARS, CEN, TEL Structure du vecteur ARS: origine de réplication levure CEN4: centromère du chromosome IV TEL: Télomères du chromosome I SUP4 EcoRI CEN ARS TRP1 pYAC4 (11,4 kb) AmpR URA3 ori TEL TEL BamHI TRP1 et URA3 : gène impliqué dans la synthèse du tryptophane (TRP1) et de l'uracile (URA3); souche de levure mutée pour ces gènes SUP4: site de clonage; suppression d'une mutation qui confère une couleur blanche aux colonies de levure Taille des inserts: 300-500 kb Clonage dans un vecteur YAC 1. Digestion partielle d'ADN de haut poids moléculaire (EcoRI) 1. Digestion du vecteur par BamHI + EcoR1 2. Déphosphorylation (phosphatase alcaline) TEL CEN TRP1 URA3 TEL SUP4 Ligature TEL 2. Sélection de fragments > 200-300 kb (Electrophorèse en champ pulsé) T4 DNA ligase CEN URA3 TEL TRP1 Transformation S. cerevisiae (sphéroplastes; souche AB1380) Culture sur milieu sélectif Sélection des colonies recombinantes 1. Couleur rouge: présence d'un insert dans le YAC (disruption du gène SUP4) 2. Croissance en absence d'uracile et de tryptophane: présence des 2 bras du vecteur Individualisation et stockage des clones Organisme Taille du génome Mbp/1C Cosmide (40 kbp) BAC (150 kbp) YAC (500 kbp) 4.6 530 140 40 Levure 12 1380 370 110 Nématode 100 1. 15 × 104 3070 920 125 1. 45 × 104 3840 1150 Nom commun (famille) Escherichia coli Saccharomyces cerevisiae Caenorhadditis elegans Arabidopsis thaliana Drosophila melanogaster Drosophile 165 1. 90 × 104 5060 1520 Lycopersicon esculentum Tomate 950 1. 09 × 105 2.92 × 104 8750 Maïs 2640 3. 04 × 105 8.10 × 104 2.43 × 104 Homme 3000 3. 45 × 105 9.21 × 104 2.76 × 104 Hordeum vulgare Orge 4880 5. 62 × 105 1.50 × 105 4.50 × 104 Triticum aestivum Blé 16 000 1. 84 × 106 4. 91 × 105 1.47 × 105 (Liliacée) 100 000 1. 15 × 107 3. 07 × 106 9.21 × 105 Zea mays Homo sapiens Fritillaria assyriaca Nombre de clones (N) nécessaires pour avoir 99% de chances d'identifier une séquence particulière dans une banque de cosmide, de BAC ou de YAC, en fonction de l'espèce. Principe de la méthode de Sanger Blocage de l'incorporation de nouveaux dNTP Brin d'ADN en cours d'élongation O #$% ! P O O H O H O Incorporation dans le brin en cours d'élongation par une ADN polymérase H H ADN polymérase O O P O P ! P O O H &$ !" Liaison phosphodiester O Base CH2 O O Base CH2 O O H H H !" H Déoxyribonucléotide triphosphate (dNTP) O O P O P O P O O H O O Base CH2 O O H H H " H H Didéoxyribonucléotide triphosphate (ddNTP) Analogue structuraux des dNTP Réaction de séquence Mélange réactionnel • ADN matrice (double brin) • Amorce • dATP, dGTP, dTTP, dCTP • ddATP, ddGTP, ddTTP, ddCTP • ADN polymerase thermostable Incubation → Thermocycleur • Dénaturation (92-95°C) • Hybridation des amorces (55-60°C) • Elongation (70-72°C) P P dNPT P ddNPT P P PP 5' P P P !" 3' !" P " Amorce 3' A P T G C C G A C G G C P P P Brin matrice P T P A P C P P 5' Amorce marquée GACCTAGAGTATCC CTGGATCTCATAGG (système LI-COR) ADN matrice + dNTP + Amorce marquée (fluorochrome ddATP ddCTP GddA GACCTddA GACCTAGddA GACCTAGAGTddA - Faisceau laser + A C G T ) + ADN polymérase ddGTP GAddC GACddC GACCTAGAGTATddC GACCTAGAGTATCddC C C T A T G A G A T C C A G Brin matrice ddTTP ddG GACCTAddG GACCTAGAddG GACCddT GACCTAGAGddT GACCTAGAGTAddT Stockage de l'information Détermination de la séquence Numérisation de l'image Enregistrement des signaux Marquage terminal (ddNTP marqués) (système Applied Biosystems) ADN matrice + dNTP + ddNTP marqués + Amorce + ADN polymérase Analyse de la séquence Stockage de l'information GACCTAGAGTATCC CTGGATCTCATAGG ddATP ddCTP ddGTP ddTTP GACCTAGAGTATC GACCTAGAGTA GACCTAGAG GACC GA G GAC GACCT GACCTA GACCTAGAGT GACCTAG GACCTAGA GACCTAGAGTAT Préparation de l'ADN matrice pour le séquençage Plasmide ADN bactérien Insert Lyse des bactéries Amplification par PCR Préparation d'ADN plasmidique Séquençage Séquençage à partir d'une matrice ADN double brin Hybridation de l'amorce avec le brin - Hybridation de l'amorce avec le brin + Synthèse du brin - synthèse du brin + Brin - Séquence du brin + Brin + Séquence du brin - Exemple: longueur maximale déterminée par le séquenceur = 1 kbp Taille de l'insert: 1,5 kbp Brin + Brin - Zone de chevauchement Séquence complète Taille de l'insert: 3 kbp Brin + Brin - Séquence partielle RFLP (Restriction Fragment Lenght Polymorphism) Paire de chromosomes homologues Mutation ponctuelle disparition du site ! Sites de restriction de l'enzyme " # ! $ Lignée A Lignée B Digestion de l'ADN par l'enzyme de restriction Miration sur gel d'agarose Transfert sur une menbrane de nylon (Southern blot) Hybridation de la sonde - Lignée A Lignée B Sonde marquée radioactivement F1 Ségrégation 1:2:1 parmi les descendants F2 + Profil d'hybridation Microsatellites (SSR pour Simple Sequence repeat) Paire de chromosomes homologues 11 répétitions du motif microsatellite 16 répétitions du motif microsatellite Lignée A Lignée B Sites d'hybridation des amorces PCR Miration sur gel de séquence (Séquenceur automatique) Visualisation du polymorphisme - + Lignée A Lignée B Amplification du locus par PCR → Amorces marquées → Incorporation de dNTP marqués F1 Ségrégation 1:2:1 parmi les descendants F2 Détection du polymorphisme de séquences par SSCP (Single Strand Conformation Polymorphism) Amplification PCR à partir d’amorces spécifiques de locus (introns, ADN non codant) Polymorphisme de taille ou de restriction rare Polymorphisme de séquence fréquent Homozygote AA Hétérozygote AB Homozygote BB Dénaturation: chaleur, formamide Migration sur gel de polyacrylamide en conditions non dénaturantes Révélation après coloration au nitrate d’argent Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998) A B A A: Ler × Col B: Ler × Cvi A B A B A B B Densité moyenne: 1 marqueur/cM Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb Chr. 1: 1 cM = 240 kb Chr. 2: 1 cM = 280 kb Chr. 3: 1 cM = 310 kb Chr. 4: 1 cM = 215 kb Chr. 5: 1 cM = 250 kb Relation entre distance physique et distance génétique Espèce Longueur du génome Distance de carte (cM) Longueur ADN (Mbp) Génome Chromosome (kbp)/cM Phage T4 * 0.16 800 - 0.2 E. Coli * 4.6 1750 - 2.6 Levure * 12 4200 260 2.8 Nématode * 100 320 A. Thaliana * 125 480-630 100-130 200-260 Drosophile * 165 280 70 600 Riz * 430 1575 130 270 haricot 650 830 75 780 Tomate 950 1270 105 750 Colza 1200 1020 55 1180 Soja 1200 2700 135 440 Maïs 2500 1860 190 1340 Souris * 3000 1700 100 1760 Homme * 3300 2800(H)–4780(F) 120(H)-210(F) 690(H)-1180(F) Blé 16 000 3500 170 4570 Pin maritime 24 000 1800 150 13 000 310 Construction de cartes physiques Regrouper et ordonner un ensemble de fragments d'ADN chevauchants provenant d'une (ou plusieurs) banques génomiques Retrouver l'ordre linéaire des fragments d'ADN tels qu'il existe sur le chromosome dont ces fragments sont issus (assignation chromosomique) 1 contig Insert de grande taille cloné dans un YAC ou un BAC Contig de clones → ordonnancement de segments continus d'ADN se chevauchant partiellement Carte physique saturée lorsque le nombre de contigs est identique au nombre de chromosomes et que l'ensemble des contigs couvre totalement le génome Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) % Numérisation des images Migration des profils de restriction sur gel d'agarose Digestion totale de l'ADN par un enzyme de restriction (6 bp) Isolement de l'ADN des BAC Digestion HindIII Ligne de dépôt Marra et al., 1999. A map for séquence analysis of Arabidopsis thaliana genome kb M 23.1 12.2 5.1 2.0 0.4 Colonies bactériennes contenant des BAC recombinants Etablissement de contigs à partir de cartes de restriction des inserts (Restriction Fragment Fingerprinting) & Images numérisées Assignation chromosomique Détermination de la taille des produits de digestion de chacun des inserts Alignement correct Alignement incorrect Carte de restriction des inserts et assemblage des contigs Utilisation des données de cartographie génétique ( marqueurs RFLP et microsatellites) pour la construction de cartes physiques Position des marqueurs moléculaires sur le groupe de liaison % & )+* ' ( ++, ' ) * + Sondes RFLP , Assignation chromosomique Hybridation de chacune des sondes avec l'ADN des clones %+& *++ , + (+) * & Dépôt de l'ADN des clones de la banque sur une série de menbrane de nylon ' % ( ) & Assemblage des contigs Chromosome 4 Chromosome 5 Cartes physiques et génétiques des chromosomes 4 et 5 d'Arabidopsis thaliana Source: http://nasc.nott.ac.uk/JIC-contig/ Utilisation des remaniements chromosomiques pour assigner des locus marqueurs à un chromosome Remaniement chromosomique: modification visible de la séquence linéaire des gènes portés par un chromosome → délétion, insertion, duplication, inversion, translocation de fragments chromosomiques Etudes de descendances: parent à caryotype normal × parent à caryotype réarrangé Chromosome 9 normal Chromosome 9 réarrangé Chromosomes recombinants Assignation chromosomique chez le maïs (Creighton et McClintock, 1931) Hybridation d'une sonde de βtubuline sur des chromosomes polytènes de drosophile Hybridation simultanée de 6 sondes spécifiques de chromosomes humains révélées par des fluorochromes différents. Hybridation d'un mélange de sondes correspondant à un contig de BAC localisé à une des extrémité du chromosome 2 d'Arabidopsis thalialiana Arabidopsis thalialiana → signal unique Brassica rapa → signaux détectés sur 6 paires de chromosomes Hybridation simultanée de 6 sondes couvrant un contig de clones BAC de 431 kbp Mycoplasmes et Bactéries O.5 - 6 Mbp Levure: 12 Mbp → 0.75 Mbp/chr. A. thaliana: 125 M bp → 25 Mbp/chr. Homme: 3000 Mbp → 130 Mbp/chr. Comment déterminer la séquence des ces génome ? Banques génomiques Techniques de Cartes séquençage physiques Cartes génétiques O utils Définition de stratégies Etablir le lien entre la séquence des clones et leur position physique sur le génome Déterminer l'ordre des clones les uns par rapport aux autre (YAC, BAC, PAC) Déterminer la séquence des clones (Cosmides, plasmides) Cartes génétiques Marqueurs cytologiques Hybridation in situ Hybrides somatiques Cartes physiques " # Séquençage " Statégie dirigée → carte physique → sous clonage et séquence d'un minimum de clones redondants # Statégie directe ou aléatoire (whole genome shotgun sequencing) → banques de plasmides et de cosmides → séquences aléatoire des clones → carte physique ! Stratégie intermédiaire (hierarchical shotgun sequencing) → carte physique → sous clonage → séquences aléatoire des clones