Clonage dans un plasmide (pUC) • Site multiple de clonage au

publicité
Clonage dans un plasmide (pUC)
• Réplication indépendante de celle du
chromosome bactérien (ori)
• Sélection des bactéries transformées
(plasmide avec ou sans insert): ampR
• Site multiple de clonage au niveau
d'une portion du gène de la β-galactosidase E. coli (LacZ').
• Sélection des bactéries transformées
(plasmide avec insert): crible blanc/bleu
en présence d'IPTG et de X-gal.
• Capacité de clonage: 3 - 4 kb
Cycles du bactériophage λ (phage tempéré)
Cycle lytique
Cycle lysogénique
Injection de l'ADN du phage dans la bactérie
Réplication de l'ADN
Synthèse des protéines
de la capside
Assemblage des
particules phagiques
Lyse bactérienne
Intégration de l'ADN du
phage dans le chromosome
bactérien (prophage)
Réplication en même temps
que le chromosome bactérien
Induction
Stimulus
externe
Excision du prophage
Génome du phage λ
Génome λ: ADN bicaténaire de 48,5 kb
Gènes essentiels au déroulement du
cycle lysogénique → 25% du génome
cosR
cosL
Gènes essentiels au déroulement du cycle
lytique (synthèse ADN, assemblage des
particules phagiques, lyse) → 60% du génome
Structures du génome
• Molécule linéaire dans les particules phagiques
• Circularisation au niveau des extrémités cos (segments d'ADN simple
brin complémentaires) dans les bactéries infectées par le phage
Construction du vecteur de clonage
BamH1
cosR
cosL
λ de type sauvage
Délétion des gènes
non essentiels au
déroulement du cycle
lytique
Gène de sélection (ex: lacZ)
cosL
Fragment de substitution
Vecteur de clonage λ (≅45 kb)
cosR Insertion d'un fragment de
substitution (≅ 15 kb)
cosR
cosL
ADN exogène
Délétion du fragment
de substitution
Insertion de l'ADN
exogène
Contrainte liée à l'assemblage de particules phagiques infectieuses
La taille de la molécule d'ADN doit être comprise entre 38 et 51 kb
Clonage de fragments d'ADN exogène de tailles comprises
entre 9 et 22 kb
(T4 DNA ligase)
cosR
cosR
Procédure de clonage
dans le phage λ
Clonage dans un cosmide
Gène de résistance à la
tétracycline (tet R)
4-6 kb
Sélection des bactéries
contenant un cosmide
recombinant
Sites cos
Site de clonage (Bgl II)
Origine de réplication (ori)
Cosmide: site cos du phage λ + plasmide
→ Clonage de fragment de 45 kb maximum (capacité λ ×3)
Sites cos λ
→ Encapsidation in vitro
→ Particules virales capables d'infecter E. coli (efficacité > transformation)
Origine de réplication plasmidique
→ Multiplication dans la bactérie de la même façon qu'un plasmide
Procédure de clonage dans un cosmide
Dephosphorylate
(alkaline
phosphatase)
(T4 DNA ligase)
Individualisation et
stockage des clones
recombinants
Vecteurs PAC (P1-derived artificial chromosome)
LoxP
Bactériophage P1
Phage tempéré; hôte E. coli
Taille du génome: 115 kb
Capacité de clonage des
vecteurs PAC : 75-95 kb
Structure du vecteur
ori: origine de réplication plasmidique
kanR: gène de résistance à la kanamicyne
P1 plasmid
replicon
ScaI
pBR322 ori
pac
pAD 10sacBII
(30 kb)
LoxP
sacB
Kan R
P1 lytic
replicon
BamHI
Pac ("packaging site"): le clivage de ce site permet l'assemblage des particules virales
LoxP: sites de recombinaison du phage P1
"P1 plasmid replicon": réplication et maintient d'une seule copie par bactérie
"P1 lytic replicon": gènes sous le contrôle du promoteur lac. Induction de par l'IPTG →
l'amplification du nombre de copies du vecteur recombinant
sacB: gène de saccharose synthase; crible de sélection des bactéries recombinantes; site
de clonage (BamH1). La dégradation du saccharose produit un composé hautement toxique
pour les bactéries. Sur un milieu contenant du saccharose, seules les bactéries dont le
gène sacB est modifié se développeront.
Empaquetage in vitro
Digestion du vecteur
BamHI + ScaI
1. Digestion partielle d'ADN
exogène
de
haut
poids
moléculaire
2. Sélection des fragments de
70-95 kb
Individualisation et
stockage des clones
Sélection des colonies contenant
un PAC recombinant
Milieu sélectif
saccharose + kanamycine
Ligature → concaténaires
Clivage des sites pac (pacase)
Circularisation
P1 plasmid P1 lytic
replicon replicon
Infection E. coli (cre+)
Recombinase
Gène
cre
Vecteurs BAC (Bacterial artificial chromosome)
lacZ'
Taille maximale des inserts
300-350 kb, le plus souvent
100-150 kb
Facteur F (fertilité) E. coli
→ plasmide impliqué dans la conjugaison
bactérienne.
→ Intégration au chromosome bactérien
réversible
→ Excision du chromosome en même temps
qu'une portion du génome bactérien (× 10100 kb → 4,6 Mb)
Structure des vecteurs BAC
oriS: origine de réplication
repE: réplication du plasmide à partie de oriS;
maintient du nombre de copies à 1-2 par cellule
parA, parB: stabilité du plasmide; incompatibilité
avec d'autres facteurs F (parB)
CMR: gène de résistance au chloramphénicol
Site de clonage dans le gène lacZ': crible de
sélection blanc/bleu
lacZ'
7 kb
1. Digestion du vecteur (HindIII)
2. Déphosphorylation
(phophatase alcaline)
Ligature
T4 DNA ligase
CMR
1. ADN de haut poids moléculaire
partiellement digéré (HindIII)
2. Sélection des fragments de taille
> 150 kb (Electrophorèse en champ pulsé)
Transformation E. coli par
électroporation
1 colonie bactérienne renfermant
1 BAC recombinant
Stockage des clones
(plaques de microtitration)
Étalement des bactéries sur un
milieu contenant du
chloramphénicol, de l'IPTG et de
l'X-gal
Sélection des colonies blanches
Vecteurs YAC (Yeast artificial chromosome)
Cellules hôtes
Vecteur sans insert, circulaire
→ E. coli → ori; agent de sélection: AmpR
Vecteur avec insert, YAC
→ S. cerevisiae → ARS, CEN, TEL
Structure du vecteur
ARS: origine de réplication levure
CEN4: centromère du chromosome IV
TEL: Télomères du chromosome I
SUP4
EcoRI
CEN
ARS
TRP1
pYAC4
(11,4 kb)
AmpR
URA3
ori
TEL
TEL
BamHI
TRP1 et URA3 : gène impliqué dans la synthèse du tryptophane (TRP1) et de
l'uracile (URA3); souche de levure mutée pour ces gènes
SUP4: site de clonage; suppression d'une mutation qui confère une couleur
blanche aux colonies de levure
Taille des inserts: 300-500 kb
Clonage dans un vecteur YAC
1. Digestion partielle d'ADN de haut
poids moléculaire (EcoRI)
1. Digestion du vecteur par BamHI + EcoR1
2. Déphosphorylation (phosphatase alcaline)
TEL
CEN
TRP1
URA3 TEL
SUP4
Ligature
TEL
2. Sélection de fragments > 200-300 kb
(Electrophorèse en champ pulsé)
T4 DNA ligase
CEN
URA3 TEL
TRP1
Transformation S. cerevisiae
(sphéroplastes; souche AB1380)
Culture sur milieu sélectif
Sélection des colonies recombinantes
1. Couleur rouge: présence d'un insert dans le YAC (disruption du gène SUP4)
2. Croissance en absence d'uracile et de tryptophane: présence des 2 bras du vecteur
Individualisation et stockage des clones
Organisme
Taille du
génome
Mbp/1C
Cosmide
(40 kbp)
BAC
(150 kbp)
YAC
(500 kbp)
4.6
530
140
40
Levure
12
1380
370
110
Nématode
100
1. 15 × 104
3070
920
125
1. 45 × 104
3840
1150
Nom
commun
(famille)
Escherichia coli
Saccharomyces cerevisiae
Caenorhadditis elegans
Arabidopsis thaliana
Drosophila melanogaster
Drosophile
165
1. 90 × 104
5060
1520
Lycopersicon esculentum
Tomate
950
1. 09 × 105
2.92 × 104
8750
Maïs
2640
3. 04 × 105
8.10 × 104
2.43 × 104
Homme
3000
3. 45 × 105
9.21 × 104
2.76 × 104
Hordeum vulgare
Orge
4880
5. 62 × 105
1.50 × 105
4.50 × 104
Triticum aestivum
Blé
16 000
1. 84 × 106
4. 91 × 105
1.47 × 105
(Liliacée)
100 000
1. 15 × 107
3. 07 × 106
9.21 × 105
Zea mays
Homo sapiens
Fritillaria assyriaca
Nombre de clones (N) nécessaires pour avoir 99% de chances d'identifier
une séquence particulière dans une banque de cosmide, de BAC ou de YAC,
en fonction de l'espèce.
Principe de la méthode de Sanger
Blocage de l'incorporation de
nouveaux dNTP
Brin d'ADN en cours d'élongation
O
#$%
! P O
O
H
O
H
O
Incorporation dans le brin en
cours d'élongation par une
ADN polymérase
H
H
ADN polymérase
O
O P O P ! P O
O
H
&$
!"
Liaison
phosphodiester
O
Base
CH2 O
O
Base
CH2 O
O
H
H
H
!"
H
Déoxyribonucléotide
triphosphate (dNTP)
O
O P O P O P O
O
H
O
O
Base
CH2 O
O
H
H
H
"
H
H
Didéoxyribonucléotide
triphosphate (ddNTP)
Analogue structuraux des dNTP
Réaction de séquence
Mélange réactionnel
• ADN matrice (double brin)
• Amorce
• dATP, dGTP, dTTP, dCTP
• ddATP, ddGTP, ddTTP, ddCTP
• ADN polymerase thermostable
Incubation → Thermocycleur
• Dénaturation (92-95°C)
• Hybridation des amorces (55-60°C)
• Elongation (70-72°C)
P
P
dNPT
P
ddNPT P
P
PP
5'
P
P
P
!" 3'
!"
P
"
Amorce
3'
A
P
T
G
C
C
G
A
C
G
G
C
P
P
P
Brin matrice
P
T
P
A
P
C
P
P 5'
Amorce marquée
GACCTAGAGTATCC
CTGGATCTCATAGG
(système LI-COR)
ADN matrice + dNTP + Amorce marquée (fluorochrome
ddATP
ddCTP
GddA
GACCTddA
GACCTAGddA
GACCTAGAGTddA
-
Faisceau
laser
+
A
C
G
T
) + ADN polymérase
ddGTP
GAddC
GACddC
GACCTAGAGTATddC
GACCTAGAGTATCddC
C
C
T
A
T
G
A
G
A
T
C
C
A
G
Brin matrice
ddTTP
ddG
GACCTAddG
GACCTAGAddG
GACCddT
GACCTAGAGddT
GACCTAGAGTAddT
Stockage de l'information
Détermination de la séquence
Numérisation de l'image
Enregistrement des signaux
Marquage terminal (ddNTP marqués)
(système Applied Biosystems)
ADN matrice
+ dNTP
+ ddNTP marqués
+ Amorce
+ ADN polymérase
Analyse de la séquence
Stockage de l'information
GACCTAGAGTATCC
CTGGATCTCATAGG
ddATP
ddCTP
ddGTP
ddTTP
GACCTAGAGTATC
GACCTAGAGTA
GACCTAGAG
GACC
GA
G
GAC
GACCT
GACCTA
GACCTAGAGT
GACCTAG
GACCTAGA
GACCTAGAGTAT
Préparation de l'ADN matrice pour le séquençage
Plasmide
ADN bactérien
Insert
Lyse des bactéries
Amplification par PCR
Préparation d'ADN plasmidique
Séquençage
Séquençage à partir d'une matrice ADN double brin
Hybridation de
l'amorce avec le
brin -
Hybridation de
l'amorce avec le
brin +
Synthèse du brin -
synthèse du brin +
Brin -
Séquence du brin +
Brin +
Séquence du brin -
Exemple: longueur maximale déterminée par le séquenceur = 1 kbp
Taille de l'insert: 1,5 kbp
Brin +
Brin -
Zone de chevauchement
Séquence complète
Taille de l'insert: 3 kbp
Brin +
Brin -
Séquence partielle
RFLP (Restriction Fragment Lenght Polymorphism)
Paire de chromosomes
homologues
Mutation ponctuelle
disparition du site !
Sites de restriction de l'enzyme
" #
!
$
Lignée A
Lignée B
Digestion de l'ADN par
l'enzyme de restriction
Miration sur gel d'agarose
Transfert sur une
menbrane de nylon
(Southern blot)
Hybridation de la sonde
-
Lignée A
Lignée B
Sonde marquée radioactivement
F1
Ségrégation 1:2:1 parmi
les descendants F2
+
Profil d'hybridation
Microsatellites (SSR pour Simple Sequence repeat)
Paire de chromosomes
homologues
11 répétitions du motif microsatellite
16 répétitions du motif microsatellite
Lignée
A
Lignée
B
Sites d'hybridation
des amorces PCR
Miration sur gel de séquence
(Séquenceur automatique)
Visualisation du
polymorphisme
-
+
Lignée A
Lignée B
Amplification du locus par PCR
→ Amorces marquées
→ Incorporation de dNTP marqués
F1
Ségrégation 1:2:1 parmi
les descendants F2
Détection du polymorphisme de séquences par SSCP
(Single Strand Conformation Polymorphism)
Amplification PCR à partir d’amorces spécifiques de locus (introns, ADN non codant)
Polymorphisme de taille ou de restriction rare
Polymorphisme de séquence fréquent
Homozygote AA
Hétérozygote AB
Homozygote BB
Dénaturation: chaleur, formamide
Migration sur gel de polyacrylamide en conditions non dénaturantes
Révélation après coloration au nitrate d’argent
Cartes génétiques d'Arabidopsis thaliana (Alonso-Blanco et al., 1998)
A
B
A
A: Ler × Col
B: Ler × Cvi
A
B
A
B
A
B
B
Densité moyenne: 1 marqueur/cM
Relation entre cartes génétiques et physiques: génome complet: 1 cM = 280 kb
Chr. 1: 1 cM = 240 kb
Chr. 2: 1 cM = 280 kb
Chr. 3: 1 cM = 310 kb
Chr. 4: 1 cM = 215 kb
Chr. 5: 1 cM = 250 kb
Relation entre distance physique et distance génétique
Espèce
Longueur du
génome
Distance de carte
(cM)
Longueur ADN
(Mbp)
Génome
Chromosome
(kbp)/cM
Phage T4 *
0.16
800
-
0.2
E. Coli *
4.6
1750
-
2.6
Levure *
12
4200
260
2.8
Nématode *
100
320
A. Thaliana *
125
480-630
100-130
200-260
Drosophile *
165
280
70
600
Riz *
430
1575
130
270
haricot
650
830
75
780
Tomate
950
1270
105
750
Colza
1200
1020
55
1180
Soja
1200
2700
135
440
Maïs
2500
1860
190
1340
Souris *
3000
1700
100
1760
Homme *
3300
2800(H)–4780(F)
120(H)-210(F)
690(H)-1180(F)
Blé
16 000
3500
170
4570
Pin maritime
24 000
1800
150
13 000
310
Construction de cartes physiques
Regrouper et ordonner un ensemble de fragments d'ADN chevauchants
provenant d'une (ou plusieurs) banques génomiques
Retrouver l'ordre linéaire des fragments d'ADN tels qu'il existe sur le
chromosome dont ces fragments sont issus (assignation chromosomique)
1 contig
Insert de grande taille cloné
dans un YAC ou un BAC
Contig de clones → ordonnancement de segments continus d'ADN se
chevauchant partiellement
Carte physique saturée lorsque le nombre de contigs est identique au
nombre de chromosomes et que l'ensemble des contigs couvre
totalement le génome
Etablissement de contigs à partir de cartes de restriction
des inserts (Restriction Fragment Fingerprinting) %
Numérisation des images
Migration des profils de
restriction sur gel d'agarose
Digestion totale de l'ADN par un
enzyme de restriction (6 bp)
Isolement de l'ADN des BAC
Digestion HindIII
Ligne de
dépôt
Marra et al., 1999. A map for
séquence analysis of Arabidopsis
thaliana genome
kb
M
23.1
12.2
5.1
2.0
0.4
Colonies bactériennes contenant
des BAC recombinants
Etablissement de contigs à partir de cartes de restriction
des inserts (Restriction Fragment Fingerprinting) &
Images numérisées
Assignation
chromosomique
Détermination de la taille des
produits de digestion de
chacun des inserts
Alignement
correct
Alignement
incorrect
Carte de restriction des
inserts et assemblage
des contigs
Utilisation des données de cartographie génétique ( marqueurs
RFLP et microsatellites) pour la construction de cartes physiques
Position des marqueurs moléculaires
sur le groupe de liaison
%
&
)+*
'
(
++,
'
)
*
+
Sondes RFLP
,
Assignation
chromosomique
Hybridation de chacune
des sondes avec l'ADN
des clones
%+&
*++
,
+
(+)
*
&
Dépôt de l'ADN des clones de la
banque sur une série de menbrane
de nylon
'
%
(
)
&
Assemblage des contigs
Chromosome 4
Chromosome 5
Cartes physiques et génétiques des
chromosomes 4 et 5 d'Arabidopsis thaliana
Source: http://nasc.nott.ac.uk/JIC-contig/
Utilisation des remaniements chromosomiques pour
assigner des locus marqueurs à un chromosome
Remaniement chromosomique: modification visible de la séquence linéaire des
gènes portés par un chromosome
→ délétion, insertion, duplication, inversion, translocation de fragments
chromosomiques
Etudes de descendances: parent à caryotype normal × parent à caryotype
réarrangé
Chromosome
9 normal
Chromosome
9 réarrangé
Chromosomes
recombinants
Assignation chromosomique
chez le maïs (Creighton et
McClintock, 1931)
Hybridation d'une sonde de βtubuline sur des chromosomes
polytènes de drosophile
Hybridation simultanée de 6 sondes
spécifiques de chromosomes humains
révélées par des fluorochromes
différents.
Hybridation d'un mélange de sondes
correspondant à un contig de BAC
localisé à une des extrémité du
chromosome 2 d'Arabidopsis thalialiana
Arabidopsis thalialiana → signal unique
Brassica rapa → signaux détectés sur 6
paires de chromosomes
Hybridation simultanée de 6 sondes couvrant un contig de clones BAC de 431 kbp
Mycoplasmes
et Bactéries
O.5 - 6 Mbp
Levure: 12 Mbp → 0.75 Mbp/chr.
A. thaliana: 125 M bp → 25 Mbp/chr.
Homme: 3000 Mbp → 130 Mbp/chr.
Comment déterminer la séquence des ces génome ?
Banques
génomiques
Techniques de
Cartes
séquençage
physiques
Cartes
génétiques
O utils
Définition
de
stratégies
Etablir le lien entre la
séquence des clones et
leur position physique
sur le génome
Déterminer l'ordre des
clones les uns par rapport
aux autre (YAC, BAC, PAC)
Déterminer la
séquence des clones
(Cosmides, plasmides)
Cartes génétiques
Marqueurs cytologiques
Hybridation in situ
Hybrides somatiques
Cartes physiques
"
#
Séquençage
"
Statégie dirigée → carte physique → sous clonage et séquence d'un minimum de
clones redondants
#
Statégie directe ou aléatoire (whole genome shotgun sequencing) → banques de
plasmides et de cosmides → séquences aléatoire des clones → carte physique
!
Stratégie intermédiaire (hierarchical shotgun sequencing) → carte physique → sous
clonage → séquences aléatoire des clones
Téléchargement