2- Les molécules d’ADN constituent le génome 2-1 La séquence d’ADN représente l’information génétique Lettres: A, T, G, C Mots: à 3 lettres (codons) Phrase: gène (information pour synthétiser une protéine). Ponctuation Livre: le génome (ensemble des gènes) 2-2 L’ADN peut se répliquer et se transmettre de génération en génération Principe de la réplication de l’ADN. Dans ce processus chaque brin d’ADN est séparé (non montré) puis chaque brin sert de matrice pour la synthèse d’un nouveau brin en orientation inverse et de séquence complémentaire. On obtient donc deux molécules double brin strictement identiques. DNA polymerase La réplication de l’ADN est assurée par une ADN polymérase. Les nucléotides du néobrin se positionnent en un ordre correspondant à la séquence inverse complémentaire de celle du brin parental en s’appariant aux nucléotides du brin parental. L’ADN polymérase établit au fur et à mesure les liaisons covalentes entre nucléotides, dans le sens 5’ vers 3’. L’ADN polymérase ne sait synthétiser un nouveau brin d’ADN qu’à partir d’une amorce, qui est un petit ARN. Ce petit ARN est synthétisé par une enzyme particulière appelée primase. Chez les bactéries, la primase synthétise uniquement l’amorce ARN. Chez les eucaryotes, la primase est capable de synthétiser l’amorce ARN, puis une petite longueur d’ADN, puis elle est relayée par l’ADN polymérase. Ouverture de la double hélice par une hélicase (non représentée) au niveau d’une origine de réplication ou ORC (une séquence particulière reconnue par l’hélicase), puis réplication bidirectionnelle par deux ADN polymérase. Au niveau d’une fourche de réplication, la synthèse des deux brins se fait un peu différemment. (a) L’ADN polymérase synthétise l’ADN dans le sens 5’ vers 3’ uniquement. Donc un brin est synthétisé de façon continue dans un sens au fur et à mesure de l’ouverture de la double, tandis que l’autre brin est synthétisé dans l’autre sens et donc obligatoirement de façon discontinue et décalée après l’ouverture de la double hélice. (b) Détails de la synthèse du brin discontinu. 2-3 L’ADN peut-être manipulé 2-3-1 On peut couper l’ADN en des sites précis à l’aide d’enzymes de restriction Les enzymes de restriction sont extraites des bactéries. L’enzyme prise en exemple, EcoRI, reconnaît une séquence précise (un palindrome de 6 paires de bases) puis coupe deux liaisons phosphodiester, de façon dissymétrique. Ce clivage génère deux fragments d’ADN terminés par deux séquences simple brin. Ces deux séquences simple brin étant de séquence inverse complémentaires, elles peuvent se réapparier. On appelle donc ces bouts des bouts collants. Quelques sites de restriction. -Les enzymes de restriction reconnaissent des sites palindromiques à 6 ou 4 paires de bases. -Les enzymes de restriction génèrent des bouts collants ou des bouts francs 2-3-2 Des fragments d’ADN de taille différente peuvent être séparés par électrophorèse Digestion d’ADN par EcoRI puis séparation des fragments de restriction par électrophorèse EcoRI clive l’ADN représenté en 5 sites (flèches), générant six fragments de tailles différentes. Ces fragments sont séparés en fonction de leur taille par électrophorèse en gel d’agarose. L’ADN, fortement chargé négativement (sur les groupes phosphate), migre vers l’ électrode positive, dans l’agarose poreux. L’ADN passe dans les pores du gel d’autant plus facilement qu’il est de petite taille. Après électrophorèse, l’ADN est révélé par un colorant fluorescent et le gel est photographié. 2-3-3 On peut hybrider des acides nucléiques Dénaturation et renaturation de molécules d’ADN double hélice. Les deux brins d’une double hélice d’ADN peuvent être désappariés par chauffage à 100°C. On appelle ce phénomène la dénaturation. En ramenant doucement la température à 37°C, les deux brins peuvent se réapparier. Ainsi, dans un mélange de molécules d’ADN, les deux brins de séquence complémentaire peuvent se reconnaître. *T *A T A G C sonde De façon générale, peuvent s’hybrider tous fragments d’acides nucléiques de séquence complémentaire: - Deux brins d’ADN - Deux brins d’ARN - Un brin d’ADN et un brin d’ARN Donc l’objet d’intérêt peut être un fragment d’ADN et la sonde peut être une sonde ADN ou ARN, ou un ARN et la sonde peut être de l’ADN ou de l’ARN 2-3-4 Une séquence d’ADN particulière peut être mise en évidence par la technique de Southern-blot La technique de Southern blot permet de détecter la présence de séquences particulières d’ADN. L’ADN chromosomique, très long, est découpé par incubation en présence d’une enzyme de restriction. Les fragments, appelés fragments de restriction, sont séparés par électrophorèse sur gel d’agarose en fonction de leur taille. Dans l’exemple du schéma, la digestion a généré trois fragments de restriction, mais la technique permet de repérer une séquence parmi des milliers d’autres. Ces fragments sont ensuite transférés sur un papier de nitrocellulose, par capillarité. Les fragments d’ADN sont dénaturés par chauffage du papier. La présence d’une séquence particulière est mise en évidence en incubant le papier dans une solution contenant des sondes de la séquence recherchée, elles aussi dénaturées, et marquées radioactivement. La sonde s’hybride avec la séquence sur le filtre. La présence de la radioactivité est révélée par autoradiographie 2-3-5 On peut coller deux fragments d’ADN Ligation de fragments de restriction à bouts collants. Dans cet exemple, les fragments de restriction de l’ADN I obtenus par digestion par l’enzyme EcoRI (a’) sont mélangés avec différents fragments de restriction de l’ADN II obtenus par digestion par EcoRI (a), TaqI (b) et HindIII (c). Les bouts collants a’ peuvent s’apparier avec a, mais pas avec b ou c. On ajoute dans la solution une ligase, une enzyme capable de créer une liaison covalente entre deux nucléotides, pour coller les deux fragments d’ADN. Cette technique permet donc de coller deux fragments d’ADN de façon orientée. La ligase peut aussi coller des extrémités franches, mais de façon moins efficace, et non orientée. 2-3-6 Une séquence d’ADN particulière peut être amplifiée 2-3-6-1 par la technique du clonage Principe général de clonage d’un fragment d’ADN dans un vecteur plasmidique. Un plasmide est un petit chromosome bactérien, autonome, qui contient des gènes de résistance aux antibiotiques (non montré). On sait extraire les plasmides des bactéries et les purifier. On y insère in vitro le fragment d’ADN à cloner. On réintroduit le plasmide recombinant dans des bactéries dépourvues de plasmide par transfection. Les bactéries effectivement transfectées sont sélectionnées grâce à leur résistance aux antibiotiques. Les bactéries transfectées sont ensuite mise en culture de façon individuelle. Chaque bactérie se multiplie sous forme d’un clone. Le fragment d’ADN inséré a donc été amplifié. Propriétés des vecteurs plasmidiques et exemple de construction d’un plasmide recombinant. (a) Des plasmides ont été modifiés de façon à faciliter l’insertion des fragments d’ADN à cloner. Une des modifications consiste à introduire une séquence dite polylinker qui contient plusieurs sites de restriction. Les plasmides contiennent aussi une origine de réplication (ORI) et un gène de résistance à un antibiotique. (b) Insertion d’un fragment de restriction d’ADN génomique dans un vecteur plamsidique. On choisit une enzyme de restriction dont le site est présent dans le polylinker ainsi qu’aux deux extrémités du fragment d’ADN génomique d’intérêt. Plasmide et ADN génomique sont digérés par cette enzyme ce qui génère des bouts collants compatibles. L’incubation du plasmide ouvert et de l’ADN génomique morcelé en présence d’un ligase permet d’obtenir le plasmide recombinant. 2-3-6-2 par PCR (polymerase chain reaction) L’ADN d’intérêt sera amplifié à l’aide de primers de séquence inverse complémentaire de celles des extrémités de la région à amplifier, d’une ADN polymérase thermostable (la Taq) extraite de bactéries vivant dans des sources chaudes et de nucléotides. Les différentes réactions de dénaturation, hybridation des primers et de synthèse par la Taq nécessitant des températures différentes, les tubes réactionnels sont placés dans des blocs chauffants changeant la température automatiquement. Le fait que la Taq soit extraite de bactéries thermophiles la rend résistante à 95°C, ce qui évite de devoir en rajouter dans le tube réactionnel à chaque cycle. La PCR permet une amplification exponentielle de l’ADN, à partir de quantités de départ très petites 2-4 L’ADN peut être séquencé 2-4-1 Principe du séquençage Méthode de Chain termination. (A) Cette méthode implique la synthèse d’un brin d’ADN complémentaire du brin à séquencer. Elle est réalisée à l’aide d’un primer et d’une polymérase. (B) Le milieu réactionnel contient, en plus des primers et de la polymérase, des nucléotides dont une petite fraction sont des didésoxynucléotides. Les didésoxynucléotides sont incorporés dans l’ADN mais bloquent l’élongation. Les didésoxynucléotides sont marqués radioactivement. (C) Si l’on met dans le tube réactionnel par exemple des ddA, la réaction de synthèse s’arrêtera à chaque T, générant des fragments d’ADN de différentes tailles se terminant tous par un A. La longueur des ces fragments donne donc la position des A dans la séquence. La même réaction est faite avec des ddC, ddG et ddT. (D) Les produits des 4 réactions de séquence sont séparés par électrophorèse en gel de polyacrylamide, dont la résolution permet de séparer les fragments de longueur différant par un seul nucléotide. Les fragments d’ADN sont ensuite révélés par autoradiographie. La séquence se lit de bas en haut. Séquençage automatique basé sur l’utilisation de didésoxynucléotides fluorescents. (A) Une seule réaction de séquence est réalisée en mélangeant les 4 ddNTP, chacun marqué par un fluorochrome de couleur différente. Les fragments d’ADN sont séparés par électrophorèse en gel de polyacrylamide. La fluorescence de chaque bande sur le gel est détectée automatiquement par un lecteur optique. (B) Le résultat de cette lecture est imprimé sous forme de pics dont la couleur représente le ddNTP. 2-4-2 Stratégies de séquençage des génomes Tailles comparées de différents génomes. Les tailles des génomes sont données en paire de nucléotides par génomes haploïdes. La méthode du shotgun. L’ADN est fragmenté au hasard. Chaque fragment est amplifié puis séquençé. La séquence totale est reconstituée grâce aux chevauchements recherchés par bioinformatique. Limites de la méthode du shotgun. (A) Problèmes dus à la présence de séquences répétées en tandem (exemple: séquence GATTA). En appliquant simplement la reconstitution par chevauchements les séquences répétées internes risquent d’être omises. (B) Problèmes dûs à la présence de séquences répétées réparties dans le génome. De la même manière, en appliquant le principe du chevauchement, les séquences situées entre les deux séquences répétées risquent d’être omises. Séquençage des grands génomes. Un génome constitué d’une molécule linéaire d’ADN de 2.5 Mb doit être séquencé. On connaît dans ce génome la position de 8 marqueur (A-H). La méthode du shotgun « génome entier » séquence d’abord des fragments au hasard, puis utilise la position connue des marqueurs, en plus des chevauchements, pour l’assemblage final. La méthode des « contigs » est basée sur une fragmentation ordonnée, puis sur le séquençage par la méthode du shotgun de chaque fragment. Exemple du séquençage du génome d’Haemophilus influenzae. H. influenzae est la bactérie responsable de la méningite. Son génome a été séquené en 1995. L’ADN a été séquencé au hasard )par sonication, ce qui génère des fragments de 1.6 and 2.0 kb. Ces fragments ont été séparés par électrophorèse en gel d’agarose. Chaque fragment est extrait du gel et amplifié par clonage. 19 687 clones ont été générés. Certains ont été séquencés plusieurs fois, ce qui a généré 28 643 séquences. L’assemblage de ces séquences par bioinformatique a pris 30 h. et a généré 140 contigs, c’est-à-dire 140 séquences continues. Restaient donc 139 trous! Bilan: 5 personnes, 2 mois pour un génome bactérien Etablissement du génome complet d’Haemophilus influenzae par recherche des séquences manquantes entre les contigs. Deux méthodes sont possibles: (à droite): Les fragments d’ADN manquant vont être générés par PCR à l’aide de primers correspondant aux séquences des extrémités de chaque contig. Toutes les combinaisons de primers seront essayées. Les combinaisons donnant un produit de PCR indiquent quels sont les contigs voisins. Les produits de PCR sont ensuite extraits du gel et séquencés. (à gauche) On génère une deuxième banque de clones. Pour repérer et séquencer uniquement les clones correspondant aux trous, on hydride la banque avec des sondes correspondant aux extrémités de chaque contig. Seuls les clones s’hybridant avec deux sondes correspondant à une séquence entre deux contigs; ils seront séquencés Séquençage du génome humain -Décidé en 1980, initié en 1987 avec 400 marqueurs connus, soit 1/10 Mb Méthode du shotgun applicable? . il faudrait 70 106 séquences pour chevauchements suffisants . Soit 70 séquenceurs automatiques, 1000 séquences par jour, 3 ans. . Mais assemblage trop complexe -En 1998: 1 marqueur/100 kb . Fragments plus grands que séquences répétées . Deux banques de clones, d’emblée: 300 000 clones avec au moins un marqueur . Chromosome par chromosome - chromosome 22 publié en 1999 - chromosome 21 publié en 2000 - séquence complète en 2001 . Consortium international académique . Société de Biotechnologie