BCM-2002

publicité
BCM-2002
Concepts et méthodes en
séquençage génomique et
assemblage de séquences
B. Franz LANG, Département de Biochimie
Bureau: H307-15
Télécopieur: (514) 343-2210
Téléphone: (514) 343-5842
Courrier électronique: [email protected]
Méthodologies biochimiques
1.
2.
3.
4.
5.
6.
Obtention des organismes et cultures
Extraction/purification d’ADN intact (haut poids
moléculaire)
Coupure de l’ADN et purification de morceaux d’ADN
de tailles définies
Clonage dans plasmides ou autres vecteurs
Séquençage avec des méthodes différentes:
(Maxam-Gilbert (chimique) ou Sanger: terminaison de
synthèse d’ADN avec dideoxi- nucléotides et
marquages, soit des amorces, soit des nucléotides
intégrées ou des terminateurs)
Artefacts de séquençage et assemblage
1. Obtention des organismes et cultures
• Commande dans les collection de souches d’espèces
(ATCC, CCMP …)
• Isolation à partir d’échantillons naturelles
• Purification des souches (e.g., mélanges d’eucaryotes et
procaryotes) par séries de dilutions, étalages sur des
pétries pour former des colonies séparées, application
d’antibiotiques spécifiques
http://megasun.bch.umontreal.ca/protists/otherprodbs.html
Protist Culture Collections Online
•
•
•
•
•
•
•
•
•
•
•
•
•
•
ACOI: Algoteca de Coimbra (University of Coimbra, Portugal) In English.
Algobank (Université de Caen, France) In French / en français
ATCC: American Type Culture Collection
Brazilian protozoa culture collection
Brazilian algal culture collection
Chlamydomonas Genetics Center strains
CCALA: Culture Collection of Algal Laboratory (Trebon, Czech Republic)
CCAP: Culture Collection of Algae and Protozoa (UK)
CCMP: Provasoli-Guillard Culture Center for Marine Phytoplankton
NEPCC: North East Pacific Culture Collection (University of British Columbia)
SAG: Sammlung von Algenkulturen Göttingen [Collection of algal cultures at the
University of Göttingen] (text in English)
SVCK: Sammlung von Conjugaten-Kulturen (University of Hamburg; list of strains,
text mostly in German)
UTCC: University of Toronto Culture Collection of Algae and Cyanobacteria
UTEX:The Culture Collection of Algae at the University of Texas at Austin
2. Extraction/purification d’ADN intact
(haut poids moléculaires)
• Désintégration des cellules
– enzymatique (glucanases, cellulases: levures, champignon)
– mécanique (billes de verre, compression/décompression,
sonification etc)
• Dans le cas des eucaryotes, option d’une séparation des
organites (noyau, mitochondries, chloroplastes, ER …)
– centrifugation différentielle
– centrifugation cinétique
– centrifugation en équilibre (e.g., Percoll)
Principes de gradients:
Équilibre: les organites (déposés
sur gradient formé de Percoll) et
les ADN/ARN (séparés par
gradient formé de sels comme
CsCl, KI) migrent dans le gradient
à la hauteur correspondant à
l’égalité des densités: densité
apparente du composé = densité
dans le gradient. Avec le Percoll,
CsCl ou KI, le gradient se forme
pendant la centrifugation à force g
élevée.
Cinétique (zonale): les ADN
migrent selon la densité du
gradient, la force g, et le temps. On
peut utiliser des gradients
préformés (comme sucrose,
glycérol), ou le Percoll.
2. Extraction/purification d’ADN intact
(haut poids moléculaires) cont.
2.1 autres séparations de macromolécules (ADN, ARN,
protéines, polysaccharides
–
–
–
–
digestions avec protéinases, RNase ….
extraction phénol, chloroforme, et autres systèmes de solvants
dialyse
gradient CsCl (équilibre) en présence de substances qui se lient a
l’ADN, dont le fluorochrome bromure d’ étidium (BE), DAPI ou
bisbenzimide (BB), qui change la densité apparente de l’ADN selon
• sa conformation (superenroulé/linéaire: BE)
• son contenu en A+T/G+C (DAPI, BB)
– électrophorèse par gel d’agarose (grands fragments) ou
polyacrylamide (petits fragments)
– chromatographie (affinité ou tamis moléculaires)
– électrophorèse en champs pulsés (agarose), pour la séparation de
chromosomes ou fragment d’ADN > 20 kbp
2. Extraction/purification d’ADN intact
(haut poids moléculaires) cont.
gel d’agarose/BE
PAGE
3. Coupure de l’ADN et purification de
morceaux d’ADN de tailles définies
• digestion avec enzymes de restriction, prédiction de la
taille moyenne des fragments selon spécificité de
l’enzyme et biais de composition de l’ADN
– digestions complètes (désavantages: pas de chevauchement de
fragments)
– digestions partielle (désavantages: difficile a standardiser, exige
beaucoup d’ADN; avantages: grande taille d’ADN)
• mécaniquement par ‘nébulisation’ (i.e., passage de la
solution de l’ADN à travers une capillaire: la viscosité de
la solution d’ADN, le pression applique, et le nombre de
cycle de passage déterminent la taille moyenne de
fragments résultants
• sonification, digestion avec la DNase I (problèmes de
biais)
4. Clonage dans plasmides ou autres vecteurs
Ingrédients :
• vecteur avec site de coupure
unique
• fragments d’ADN génomique
de tailles définies (adéquate
pour le vecteur utilisé)
• bouts d’ADN génomique
compatible avec vecteur,
pour la ligation
• sélection de transformants
• sélection d’insertions d’ADN
4. Clonage dans plasmides ou autres vecteurs
•
•
•
clonage de bouts
francs versus bouts
cohésifs
clonage de fragments
PCR/séquençage
direct
vecteurs de clonage
alternatifs (M13,
phagemides,
cosmides, BAC, YAC,
phage lambda …)
4. Clonage dans plasmides ou autres vecteurs
Avantages/désavantages de différents types de
vecteurs pour le séquençage génomique
•
•
•
•
•
•
M13: technologie simple, haute qualité de séquences (produit simples brins),
tailles d’insertion très limitées (< 2 kbp)
Plasmides: technologie simple, tailles d’insertion limitées (< 20 kbp)
Cosmides: tailles d’insertion plus grandes (< 30 kbp), clonage très efficace
mais difficile, plus difficile en séquençage (rendement d’ADN)
BAC (bacterial artificial chromosomes): très populaires, tailles d’insertion
grandes (jusqu’à quelques 100 kbp), mais difficile en séquençage
YAC (yeast artificial chromosomes): peu utilisés, instables, recombinaisions
Phage lambda: tailles d’insertions modeste (< 20 kbp), mais systèmes de
clonage très efficaces (in vitro packaging; sélection positive d’insertions).
Souvent utilisé pour le clonage de banque d’ADNc
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
Rappel:
• polarité de l’ADN, convention d’écrire les séquences de
5’ à 3’ (ou indiquer la polarité)
• ADN monocaténaire et bicaténaire (M13/phagemides
versus autres vecteurs de clonage)
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
Principes de séquençage (définition selon Maniatis):
The two rapid sequencing techniques in current use are the
enzymatic method of Sanger et al. (1977) and the chemical
degradation method of Maxam and Gilbert (1977). Although very
different in principle, these two methods both generate separate
populations of (radio- or fluorochrome-) labeled oligonucleotides
that begin from a fixed residue or combination of residues. …
These populations of oligonucleotides are then resolved by
electrophoresis under conditions that can discriminate between
individual DNAs that differ in length by as little as one nucleotide
(PAGE). When the populations are loaded into adjacent lanes of a
sequencing gel, the order of nucleotides along the DNA can be read
directly from an image (radioactive or optical) of the gel.
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
5.1 Maxam Gilbert (procédures, les points spécifiques M&G en rouge)
•
•
•
•
•
•
•
•
•
•
clonage de fragments, purification de l’ADN (plasmides, M13 …)
coupure avec enzymes de restriction
marquages de bouts de fragments d’ADN (radioactif, fluorescent)
séparations de fragments, et purification sur gel
[les deux opérations suivantes servent à générer des molécules d’ADN, dont
seulement un brin est marqué]
deuxièmes clivages avec des enzymes de restriction, et re-purification
alternativement, séparation des deux brins d’ADN après dénaturation,
migration dans gels PAGE semi-dénaturants, et purification d’ADN simple
brins
modifications chimiques partielles (!), spécifiques pour une ou plusieurs
nucléotides (voir tableau précèdent)
clivage par la pipéridine
dissociation des brins d’ADN (!; formamide, chauffage) et séparation sur gel
d’acrylamide haute résolution
autoradiographie ou lecture du signal fluorescent
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
Principes de séquençage M&G :
Marquages de fragments d’ADN purifiés:
5. Séquençage avec des méthodes différentes
(Maxam Gilbert)
L’ADN est marqué
3-5 réactions de modifications
chimiques (partielles)
suivie par le clivage des sites
modifiés
5. Séquençage avec des méthodes différentes
(Maxam Gilbert)
Les mêmes molécules d’ADN
marquées, après clivage des
sites modifiés
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
Principes de séquençage M&G
(figures alternatives):
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
5.1 Maxam Gilbert
Principe: coupures chimiques d’ADN (90oC pipéridine, 1M) après diverses
modifications chimiques spécifiques, partielles (!!!)
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
Principe de décodage:
Séparation sur gel d’acrylamide haute résolution; concentration de gels entre 3%20%, selon les positions de nucléotides à lire (dans l’exemple: 3.5 %)
Devoir pour la prochaine session:
Essayez de lire ces trois séquences, et de les identifier et analyser avec les
outils que vous connaissez. L’ordre des réactions montrées (Sanger) et G,A,T,C,
de gauche a droite
5. Séquençage avec des méthodes différentes
(Maxam Gilbert et Sanger)
5.1 Maxam Gilbert, avantages/désavantagés
•
•
•
•
Exige beaucoup d’ADN, et la purification de fragments a plusieurs reprises
Lectures relativement courtes sur systèmes de gels manuels
Automatisation n’est pas disponible (séquenceurs)
Utilisation de M&G pour ‘footprinting’ (parties de l’ADN protégées par des
protéines liées ne seront pas modifiées et clivées)
•
La méthodologie de séquençage Sanger n’exige peu ou pas de
purification de matrices d’ADN, aucune coupure avec des enzymes
de restriction, et aucun marquage de l’ADN a séquencer.
5. Séquençage avec des méthodes différentes
5.2 Sanger, terminaison d’une polymerisation avec des ADN
polymérases, en présence de déoxi- et dideoxinucléotides
(procédures, les points spécifiques en rouge)
•
•
•
•
•
•
Clonage de fragments, purification de l’ADN (plasmides, M13 …), ou
purification de n’importe quel ADN génomique, produit PCR … en bonne
concentration
Dissociation de l’ADN et hybridation avec amorce(s) synthétiques (qui
pourraient être marquées,e.g., pour séquençage sur LiCOR)
Deux amorces peuvent être utilisées (par example, ‘forward’ et ‘reverse’) si
le système de détection est capable de distinguer des marquages avec des
fluorescent différent (LiCOR)
Élongation de l’amorce avec ADN polymérase (T7, Taq, Thermosequenase
…), en présence d’un mélange bien balancé de déoxi- et dideoxinucléotides
(les nucléotides ou les terminateurs dideoxi pourraient être marqués;
technologie terminateurs sur séquenceurs MJ, ABI)
dissociation des brins d’ADN (!; formamide, chauffage) et séparation sur gel
d’acrylamide haute résolution (gel horizontaux ou verticaux; capillaires)
autoradiographie, ou lecture du signal fluorescent par séquenceurs
5. Séquençage avec des méthodes différentes
(Sanger)
Principes de séquençage
Sanger
Polymérisation avec ADN
polymérase, en presence des 4
dNTP, et d’une quantité limitée
de ddNTP, a partir d’une
amorce synthétique.
Ici: la réaction avec ddTTP.
5. Séquençage avec des méthodes différentes
(Sanger)
Principes de séquençage Sanger
Schéma des réactions avec 4 ddNTP.
5. Séquençage avec des méthodes différentes
(Sanger)
5. Séquençage avec des méthodes différentes
(Sanger)
6. Artefacts de séquençage et assemblage
• L’ADN dénaturé se replie sur elle-même, après avoir
chargé le gel de séquençage
– raison: structures secondaires, surtout dans les régions d’ADN
hautement structuré et riche en G+C)
– effet: zones de ‘compressions’ dans l’échelle de séquençage
– mesures a prendre: (i) séquencer l’ADN sur les deux brins, donc dans
les deux directions; alors les artefacts ne se trouve pas exactement aux
même positions de la séquence (asymétrie dans le repliement des deux
brins); (ii) dans le cas de Sanger, utiliser des nucléotides dans le
séquençage, qui minimisent la formation de structure secondaire (i.e.,
leur énergie de formation), dont les déazaNTP, déazadITP, ou ITP (les
derniers, au lieu de dGTP)
6. Artefacts de séquençage et assemblage
• L’échelle de séquençage fini prématurément ou contient
des ‘trous’
– raisons: (i) réactions de séquençage avec trop de modifications
chimiques (M&G) ou trop de terminateurs (Sanger); (ii) zone d’ADN
avec biais de nucléotides, surtout, longues séries de A ou T qui cause
que certaines polymérases décrochent de leurs matrice de synthèse
(Sanger)
– mesures a prendre: (i) adapter les réactions; (ii) utiliser d’autre
polymérases comme la T7 DNA polymérase, qui ne permet pas un
cyclage de réactions comme dans le PCR (ce qui est couramment utilisé
pour les réactions de séquençage Sanger); la méthode Maxam Gilbert
n’est pas affectée par cet artefact
Téléchargement