I - Outils principaux en Biologie Moléculaire

publicité
BIOLOGIE MOLÉCULAIRE
PARTIE I : OUTILS PRINCIPAUX EN BIOLOGIE MOLÉCULAIRE
CHAPITRE I : L’ÉTUDE DE L’ADN PAR LA BIOLOGIE MOLÉCULAIRE
I – ORGANISATION ET PROBLÉMATIQUES
L’ADN est un polymère de nucléotides (désoxyribose – base) reliés par liaisons 5’-3’ phosphodiester, qui se lit de 5’ vers 3’. Les
brins sont complémentaires et antiparallèles. Il existe deux types de bases, les purines (A et G) et les pyrimidines (T et C) :
• A et T se lient par deux liaisons hydrogènes
• C et G se lient par trois liaisons hydrogènes
Deux événements importants vont alors avoir lieu :
- L’ADN est transcrit par les RNA Polymérases dans le noyau, formant de l’ARN. Cette transcription est commandée par
un promoteur, séquence d’ADN située environ à 30 paires de bases en arrière de l’endroit ou commence la séquence
d’ARN qui sera obtenue (chez les eucaryotes). La plupart de ces promoteurs sont des répétitions de T et A, appelés
« TATA Box ». La séquence à transcrire se termine par un terminateur de transcription. L’ARN se présente avec une
séquence 5’UTR, non traduite, une séquence codante qui commence avec un codon AUG et termine avec un codon
STOP, et une séquence 3’UTR qui elle non plus n’est pas traduite : ce sont des régions régulatrices.
- Cet ARN est traduit par les ribosomes dans le cytoplasme. Avant cela, si c’est un ARNm, il va subir des modifications (cf.
Génétique L2) : coiffage (7MeGuanine) en 5’, poly-A en 3’, maturation (suppression des introns). Ces processus peuvent
être freinés par les RNAses. Ceci fait, le ribosome peut traduire, à partir du AUG de départ, lequel est reconnu par le
ribosome car précédé du consensus de Kozack CPuCCATGPu.
9
L’ADN mesure environ 2m par cellule. Le génome humain, lui, est composé de 3.10 pb et moins de 30 000 gènes, répartis sur
les chromosomes qui comptent chacun quelques centaines à quelques milliers de gènes. 1 gène fait de 50 à 100 Kpb.
On va avoir deux problèmes relatifs à l’étude de l’ADN :
Longueur : L’ADN est très long. On va donc devoir le couper à l’aide d’enzymes de restrictions (endonucléases).
Originellement découvertes chez les bactéries pour détruire les ADN parasites, elles reconnaissent des séquences
strictement spécifiques, palindromiques, de l’ADN et coupe les liaisons phosphodiester, formant soit une extrémité
franche, soit une extrémité cohésive. Pour éviter d’avoir un chromosome coupé par les enzymes, on va méthyler les
sites de restrictions à protéger via une méthylase
Quantité non-codante de l’ADN : il y a pas mal de séquences qui ne codent pas au sein de l’ADN et notamment les
séquences répétées qui représentent 50 % de l’ADN du génome humain.
Pour séquencer l’ADN, on va avoir besoin d’une ADN polymérase et d’amorces aléatoires. On peut ensuite connaitre la séquence
en insérant dans un plasmide un bout d’ADN. Cela nécessite qu’on puisse utiliser beaucoup d’ADN purifié, ce qui n’est possible
que par l’intervention de clonage.
II - CLONAGE ET VECTEURS
Pour reproduire l’ADN à l’identique, il nous faut un système cellulaire : On doit alors l’introduire dans un organisme hôte, qui va
le reproduire – utilisation de petites bactéries, non-pathogènes, toutes simples comme E.coli pour des transformations
bactériennes (un choc osmotique et un choc thermique pour faire des pores). Dans 99.9 % des cas c'est totalement inefficace
(ADN dégradé, ou bactérie qui meure). L’ADN injecté doit au préalable être inséré dans un vecteur, qui sera donc ici un plasmide
de quelques kpB : ainsi, l'ADN reste intact dans la bactérie et va y être répliqué. Ce vecteur est un ADN circulaire contenant :
- Une origine de réplication
- Un gène de résistance à un antibiotique
Par Krys3000 (Groupe « The Trust » - http://www.cours-en-ligne.tk/)
Page 1
Des sites de restrictions, et un site unique pour la même enzyme. Cela va nous permettre de couper avec cette enzyme
et de balancer en large excès le fragment d’ADN à insérer avec une ligase. Certains des plasmides vont avoir reçu l'ADN
recombinant.
Dans la nature, il n’existe pas de plasmides possédant tout plein de sites uniques de restriction. Mais on peut en fabriquer. De
tels condensés de sites sont appelés polylinkers.
-
Lors d’une transformation, on va se retrouver avec 4 cas :
1. Les bactéries transformées ayant donc intégré le vecteur recombinant. C’est ce qu’on veut garder.
2. Les bactéries non-transformées qui n’ont intégré aucun vecteur. On peut les écarter en faisant pousser les bactéries sur
un milieu contenant l’antibiotique correspondant au gène de résistance du plasmide.
3. Les bactéries ayant intégré un des vecteurs vides. On peut les écarter par vérification de la fonctionnalité de la partie
« coupée » en deux pour y intégrer le vecteur (principe de la β-gal)
4. Les bactéries ayant intégré les deux vecteurs. En mettant beaucoup moins de plasmide que de bactéries, on écarte déjà
de façon énorme cette probabilité.
On peut enfin faire une électrophorèse sur les bactéries pour vérifier qu’on est bien dans le cas 1.
L’étude de gène nécessite que celui-ci puisse être transcrit et traduit – il faut donc faire très attention aux moyens utilisés, et
conserver la bonne machinerie (ADN Eucaryote dans une cellule eucaryote, promoteurs, etc.…). Un vecteur capable de faire
exprimer une protéine est alors nommé « vecteur d’expression ». Le souci des cellules eucaryotes, c’est que l’ADN, enfermé
dans le noyau, est difficilement accessible. Comme on ne sait pas trop faire de chromosomes artificiels eucaryotes, on va
employer des plasmides recombinant dans les cellules, et les faire transcrire par des ARN polymérases. La sélection pour les
eucaryotes peut se faire via un gène de résistance à un poison par exemple.
On peut utiliser des gènes rapporteurs (voir partie II) pour mesurer alors l’expression des gènes.
CHAPITRE II : CARTOGRAPHIE DU GÉNOME HUMAIN
I - CARTOGRAPHIE PHYSIQUE DES MARQUEURS
L’on peut donc cloner afin d’avoir l’ADN en grandes quantités. Cela nous permet alors de faire des banques, collection de clones
recouvrant tout le génome en procédant par digestions ménagées de génomes. Mais cela cause toujours le problème de
chevauchement du aux séquences répétées. Pour cette raison, on va faire appel aux marqueurs.
Un marqueur est un fragment d’ADN qui s’hybride dans un génome donné et dont on dispose sous forme de clone. Il portera
alors un nom du type D (pour DNA) – Numéro du chromosome – Type (S : Unique, Z : En tandem, NF : répétée) – Numéro, par
exemple D1S200.
Le marqueur est une caractéristique phénotypique particulière qui peut être utilisée pour obtenir des informations sur le
génome. Tout fragment d’ADN peut servir de marqueur (même si ce n’est pas une séquence traduite : on parle de marqueurs
anonymes). Un marqueur doit posséder plusieurs versions allélique (sinon, ce n’est pas un marqueur génétique mais un
marqueur physique.
On peut hybrider ces marqueurs directement sur les chromosomes en métaphases avec une solution qui permettra de
débobiner l’ADN. On fait ensuite une autoradiographie et par coloration, on observe le résultat. Les bandes obtenues disposent
d’écart de l’ordre du MpB ce qui permet des cartographies à basse résolution. Beaucoup de cartographies reposent sur
l’utilisation des marqueurs – ce sont des cartographies physiques.
II - CARTOGRAPHIE GÉNÉTIQUE DES MARQUEURS
La cartographie nécessite une maitrise de la notion de polymorphisme, c'est-à-dire l’existence d’au moins deux phénotypes
différents pour un locus dans une population. Entre deux individus non apparentés dans le génome humain, 1 nucléotide sur
1250 pb diffère. Ce type de polymorphisme est appelé SNP (Single Nuclear Polymorphism).
Lorsqu’un SNP est situé sur un site de restriction, on a un RFLP, Restriction fragment length Polymorphism, que l’on peut
détecter par action d’une enzyme de restriction puis southern blot. On obtient un Smear (voile continu) c’est pourquoi il faut
toujours hybrider avec une sonde pour distinguer les formes alléliques. Selon que celle-ci est avant/après ou chevauchante avec
le site, on obtiendra logiquement pas le même nombre de fragments.
Par Krys3000 (Groupe « The Trust » - http://www.cours-en-ligne.tk/)
Page 2
Par RFLP, on va donc pouvoir analyser l’homozygotie / hétérozygotie d’une famille et faire du dépistage génétique de maladies
ou des tests de paternité. On fait alors une recherche systématique des RFLP chez des personnes apparentées. Sachant que la
ଵ
ଵ
ଵ
nucléotides, et celle de la présence d’un site de restriction de ల =
, on obtient donc comme
fréquence des SNP est de
ଵଶହ଴
ସ
ସ଴ଽ଺
9
fréquence pour les RFLP un total de 1 nucléotide sur 5 000 000, soit, dans un génome humain de 6.10 pb, cela donne plus de
1200 RFLP par enzymes, et donc, pour les 300 enzymes de restriction connues, 300 000 RFLP possibles pour étudier le génome.
III - SHORT TANDEM REPEATS
Ce sont des séquences répétées dont le nombre de répétition définit la version allélique de ce « minisatellite ». Dans le cadre
des marqueurs non-liés génétiquement, c'est-à-dire sur des chromosomes différents, on a au maximum 50 % de recombinaison.
En conclusion, on va utiliser les RFLP pour poser des marqueurs ET trouver des distances entre échantillons conséquents, ce qui
va nous permettre d’établir des distances entre RFLP et locus morbide (locus entrainant des phénotypes pathogènes) et donc de
faire du diagnostic génétique.
Ces techniques sont utilisées sur des petits génomes mais ne peuvent être employés sur des grands. En effet, il nous faut
générer des fragments plus grands.
IV - GÉNÉRATIONS DE GRANDS FRAGMENTS D’ADN
Pour générer des grands fragments on utilisera des rare cutters, enzymes de restrictions à sites palindromiques longs et donc
ଵ
plus rare, ce qui fait qu’ils coupent moins souvent. C’est le cas de NotI (GCGGCCGC) avec une fréquence de ఴ. On retrouve ce
ସ
genre de séquences aux régions promotrice, la majorité des promoteurs étant régulés par méthylation de l’ADN influant sur le
taux de transcription.
En digérant partiellement avec de tels enzymes, on obtiendra de grands fragments, mais très fragiles. On va donc avoir recours à
des techniques d’électrophorèses en champ pulsé qui peuvent séparer les grands fragments à l’aide d’une inversion de polarité
induisant le réarrangement du polymère, dans un milieu visqueux (gel).
Ces grands fragments, on veut pouvoir les cloner. Il faut pour cela disposer de vecteurs pouvant accumuler un insert de très
grande taille. On a commencé par créer des BAC, chromosomes artificiels de bactéries, qui contiennent des éléments du facteur
F (facteur de conjugaison) sans les éléments du mécanisme même, mais avec un polylinker. La taille restait toutefois trop
limitée, ce qui nous a obligé à utiliser des chromosomes artificiels de levure, YAC, pour les chromosome multiples. Ces vecteurs
étant des vecteurs navettes, on peut les amplifier chez la bactérie et les transférer dans des levures pour le clonage.
Par Krys3000 (Groupe « The Trust » - http://www.cours-en-ligne.tk/)
Page 3
Téléchargement