Chapitre 1 Caractéristiques générales des acides nucléiques (ADN et ARN) 1. Définition Les acides nucléiques sont des macromolécules formées d’une longue chaîne (brin) de monomère, appelés nucléotides. La fonction principale des acides nucléiques Stockage sous forme stable de l’information génétique La transmission de l’information génétique L’expression de l’information génétique La réparation de l’information génétique Les acides nucléiques sont de deux types : - l’acide désoxyribonucléique (ADN) - l’acide ribonucléique (ARN). 1 1.1. L’ADN : Acide DésoxyriboNucléique: une molécule essentielle dans tout système vivant : ♦ Elle constitue le support biochimique de l’information génétique. ♦ Elle contient sous forme codée les instructions qui déterminent le développement et le fonctionnement d’un organisme ♦ Elle assure la transmission de cette information de génération en génération, et cela avec la plus grande fidélité possible. C’est ce qu’on appelle l’hérédité. Chromosome Réplication de l’ADN Deux molécules d’ADN 1.2. Les ARN: Acides RiboNucléiques Rôle de support de l’information afin : ♦ d’être traduit en protéines (ARN messager), ♦ ou bien un rôle structurale (ARN ribosomiques), ♦ ou de transport (ARN de transfert), ♦ Ils peuvent aussi être impliqués dans certains processus cellulaires comme la transcription, l’épissage, la régulation de l’expression des gènes (petits ARN : Sn RNA). Noyau Protéine 2 1.3. Structure de l’ADN - L'ADN est un polymère non ramifié formé d’un enchaînement de monomères appelés nucléotides. - Chez les eucaryotes,: Localisation : noyau cellulaire, mitochondries, chloroplastes. - Dans le noyau, l’ADN est linéaire et représenté sous forme de chromosomes. 1.3. Structure de l’ADN - Chez les procaryotes (organismes unicellulaires sans noyau), tels que les bactéries, l’ADN est en général présent dans le cytoplasme sous la forme d’un seul chromosome circulaire superenroulé. Plasmides Chromosome bactérien 3 Structure de l’ADN Unité structurale de l’ADN Les nucléotides : Un nucléotide comporte trois composants : 3 2 2-oxy-4-aminopyrimidine 5-méthyl-2, 4-dioxypyrimidine 2, 4-dioxypyrimidine 4 Les sucres: quelques caractéristiques - 2’ H est moins attaquable qu’un OH. Le désoxyribose confère à cet acide nucléique une plus grande stabilité propre à sa fonction de conservation de l’information génétique. En 3’ la position sera bloquée par la liaison phosphodiester Phosphates Le phosphate inorganique est un ion stable formé à partir de l’acide phosphorique PO4H3. On l’écrit souvent Pi. Le groupement acide phosphorique donne aux acides nucléiques leur caractère acide (chargés négativement à pH neutre). 5 Liaisons 6 Structure des acides nucléiques : les nucléosides mono-, di- et tri-Phosphates Polymérisation des Acides nucléiques Enchaînement des nucléotides 7 Enchaînement des nucléotides Le premier nucléotide de la chaîne porte, par une liaison ester sur le carbone 5’ de son ribose un phosphate dont les deux autres fonctions acides ne sont pas estérifiées. C’est l’extrémité 5’phosphate terminale de l’acide nucléique, qu’on désigne par convention comme le début de la séquence ou du fragment d’acide nucléique PPi 1 molécule d’eau est éliminée entre un OH de l’acide phosphorique et l’H de la fonction alcool située en 3’ de l’ose Liaison Phosphodiester Nucléotide + Nucléotide Dinucléotide Enchaînement des nucléotides Dans un acide nucléique, les nucléotides sont assemblés entre eux par des liaisons phosphodiester associant le désoxyribose de nucléotides voisins. Chaque phosphate lie le groupement hydroxyle (OH) du carbone 3’ du désoxyribose d’un nucléotide à l’hydroxyle du carbone 5’ du désoxyribose du nucléotide adjacent. Ainsi, le squelette désoxyribophosphate de la chaîne polynucléotidique a la polarité spécifiée par les liaisons phosphodiesters. La condensation se fait à partir d’un substrat « activé » : un des nucléosides triphosphates. 8 Sens de lecture d’un acide nucléique Le squelette de l’ADN est formé d’une succession de séquence de sucre - phosphate. Les 3'-hydroxyl et 5'-hydroxyl groupements du désoxyribose sont liés aux groupements phosphate Le dernier nucléotide de la chaîne porte une fonction alcool sur le carbone 3’ de son ribose. Cette fonction alcool n’est pas estérifiée. C’est l’extrémité 3’-OH terminale de l’acide nucléique, qu’on désigne par convention comme la fin de la séquence ou du fragment d’acide nucléique. Les expériences de Chargaff : • Chargaff détermina la quantité relative de différentes bases dans des échantillons d’ADN. • les rapports entre les 4 bases étaient assez variables suivant les types d’organismes • Le nombre de purines égalait toujours le nombre de pyrimidines dans un échantillon d’ADN donné : • Ces observations ont suggéré que les nucléotides puriques et pyrimidiques soient appariés dans l’ADN et ont mené à l’idée que des liaisons hydrogènes entre purines d’une chaîne et pyrimidines de l’autre chaîne associent les brins de la double hélice. 9 l’ADN est une double hélice car : On dispose des données suivantes: Composition chimique de l’ADN est sucre, base et phosphate Clichés de diffraction X en croix caractérisant la structure en hélice Travaux de Chargaff sur le contenu en bases (A=T et G=C) Travaux en microscopie électronique montrant que le diamètre de l’ADN est de 20 A suggérant que cette molécule comportait 2 chaînes sucre - P La double hélice d’ADN. Une molécule d’ADN est formée par deux brins d’ADN qui s’associent en orientation opposée, avec les bases orientées vers l’intérieur et les squelettes sucre-phosphate en surface. Les 2 brins s’enroulent en double hélice. La double hélice est stabilisée par des liaisons hydrogène qui s’établissent entre les bases: les bases A ne peuvent s’apparier qu’avec les bases T, et les bases C qu’avec les bases G. De ce fait, on dit que les 2 brins d’ADN sont de séquence inverse complémentaire. 10 L’enroulement en double hélice créé deux sillons, un majeur et un mineur. Caractéristiques de l'ADN - elle est antiparallèle : L’ADN est formé de deux brins de nucléotides. Ces deux brins sont disposés dans des directions opposées. Un brin est orienté dans une direction 5’_3’, et le second brin sera parallèle au premier et dans la direction inverse 3’-5’. - elle est complémentaire : l’appariement des bases des deux brins d’une molécule d’ADN se fait suivant la règle de complémentarité: A toujours apparié avec T, C toujours apparié avec G. Cette complémentarité repose sur des raisons stériques (encombrement dans l’espace) et sur la formation de liaisons hydrogène - elle est hélicoïdale : dans l’espace les deux chaînes présentent une configuration hélicoïdale. Elles s’enroulent autour d’un axe imaginaire pour constituer une double hélice à rotation droite. L’ADN est en fait composé de deux brins se faisant face, et formant une double hélice -Comme une molécule d’ADN est double-brin, on dit qu’elle est bicaténaire - La double hélice de l’ADN est stabilisée par : 1- les liaisons hydrogènes entre les bases ; 2 - Les interactions hydrophobes et électroniques entre les bases ; 3- Les interactions des groupements sucre et phosphate avec le milieu aqueux (interactions hydrophiles). 11 La double hélice (axe): La double hélice (travers) : les bases azotées sont parallèles entre elles, leurs noyaux empilés comme des assiettes au centre de la double hélice. • Les désoxyriboses et les phosphates se trouve à l’extérieur de la molécule. • Les bases azotées sont tournées vers l’intérieur de la double hélice. Les nucléotides complémentaires n’étant pas tout à fait diamétralement opposés, l’axe de l’hélice est vide. Des changements de conformation des sucres et des bases produisent différentes formes d’hélices: A, B & Z La forme (B) une double hélice droite. La plus répandue dans la cellule ♦ Les bases qui la composent sont planes et forment des plans parallèles dans la double hélice. ♦ Ces plans sont perpendiculaires au grand axe de la double hélice. Un tour = un pas = 10 paires de bases =34A. ♦ Les groupements phosphates créent des arêtes formant deux sillons. ♦ C’est au niveau des ces sillons que s’effectuent les interactions avec les facteurs de transcription permettant la régulation de l’expression des gènes. 12 La forme (A) Une hélice droite, diamètre plus grand, de pas plus petit (donc, plus resserre que l’hélice (B) Les plans de paires de bases sont inclinés de 20° par rapport au plan perpendiculaire au grand axe. Elles se trouvent en très faible quantité. Stable en milieu anhydre: apparaît si hygrométrie < 75% La forme (Z) Hélice gauche (lévogyre). Physiologique mais présente en très faible quantité. Elle est stable à haute concentration en sel dans laquelle la ligne qui joint les centres de gravite des désoxyribonucléiques semblent former un zigzag lorsqu’on les regarde de côté. 1- Taille des acides nucléiques : La taille des acides nucléiques est exprimée en trois unités selon l'usage : - la longueur - la masse moléculaire en Dalton (Da). - le nombre de nucléotides (ou bases), noté b, pour les molécules simple brin et le nombre de paires de base, noté pb, pour les molécules double brin. Pour les ARN, le nombre de nucléotides varie de plusieurs dizaines à plusieurs milliers : - ARN ribosomaux : de 100 à 5000 b - ARN de transfert : de 75 à 90 b - ARN messagers : fonction du gène transcrit Pour les ADN, le nombre de nucléotides varie de 5000 à plus de 100 millions de pb. 2- Solubilité : L’ADN devient un sel d’acide en milieux aqueux et est ainsi soluble. Il précipite en présence d’éthanol et d’une forte concentration saline. Cette propriété permet sa purification. 13 3- La charge : - La charge de ces molécules à pH physiologique est négative. - Charge dont la contribution est uniquement due aux groupements phosphates (à ce pH, les bases ne portent aucune charge). - Cette propriété est utilisée pour les séparer par électrophorèse. 4- Spectre d’absorption Les hétérocycles des différentes bases ainsi que leurs dérivés, nucléosides ou nucléotides, présentent des spectres d'absorption caractéristiques dans l'ultraviolet et sous forme de courbe en cloche entre 230 et 320 nm avec un pic à 260 nm L’absorbance à 260 nm est beaucoup plus intense lorsque l’ADN est sous forme simple brin (facteur 12 à 40% à quantité de base égales évidemment). Les protéines absorbent un peu à 260 nm, mais surtout à 280 nm. Cette absorption dans l’UV permet de détecter, de doser les acides nucléiques et d’estimer la contamination par les protéines lors de la purification des acides nucléiques. 5- Dénaturation et renaturation : hybridation des brins de la double hélice : Les liaisons hydrogène qui maintiennent la structure en double hélice sont des forces faibles Des quantités relativement petites d’énergie peuvent séparer les deux brins- un processus appelée : dénaturation ou fusion. En solution, l’ADN en double hélice est aisément dénaturé en ses chaînes polynucléotidiques simples, par chauffage à près de 100°C, ou par des agents déstabilisent les liaisons hydrogènes comme les solutions alcalines ou les solutions concentrées de formamide ou d’urée. La dénaturation se fait également si les liaisons hydrogènes entre les bases des deux chaînes sont rompues à des PH extrêmes (inférieur à 3 ou supérieur 10). Renaturation (exige des conditions particulières Chaleur, OH- État natif État dénaturé simple brin État renaturé 14 Température de fusion « melting temperature » Tm Tm = la température pour parvenir à 50% de séparation de deux brins. brins La Tm est influencée par deux facteurs principaux : - sa taille (exprimée en nombre de bases, kb ou Mb …) - son rapport (A+T)/(C+G) (composition en bases de l’ADN) - par une variété de facteurs (tels que les cations monovalents ou divalents (Mg, Cu), les polyamines et les protéines). Les brins d’une molécule donnée d’ADN se séparent à l’intérieur d’une échelle de températures. - Détermination de la température de fusion (Tm ) : L’ADN est dissoute dans une solution saline standard à pH avoisinant la neutralité. La solution est placée dans une cuve de quartz dans un spectrophotomètre puis la cuvette est chauffée doucement et on la lecture se fait à 260 puis on trace la courbe DO en fonction de la température. La propriété de dénaturation est visible par lecture de l’absorption optique de la solution contenant l’ADN à 260 nm. la densité optique augmente au cours du désappariement (effet hyperchrome), dû à une perte de l’empilement des bases (stacking) conduisant une meilleure excitabilité des e- des cycles aromatiques des bases azotées. L’énergie thermique apportée devient alors suffisante pour rompre les liaisons H inter-brins. 15 Ce sont d’abord les appariements A-T qui se séparent les premiers au cours de la montée de la température suivis des G-C. Lors d’une élévation progressive de la température, il se forme des yeux d’ouvertures dans l’ADN. La température de fusion correspond au domaine de température étroit dont le point moyen est la Tm. Un poly AT a une Tm de 70°C ; un poly GC a une température entre 100 et 130°C. L’effet hyperchrome : L’effet hyperchrome de l’ADN consiste en un chauffage d’une solution d’ADN. On assiste alors à une diminution de la viscosité et une augmentation concomitante de la densité optique à 260 nm. Variation de Tm en fonction de contenu en G et C • L’ADN riche en paires G-C, qui ont trois liaisons hydrogène, fond à une température plus élevée que celui riche en paires A-T, qui ont deux liaisons hydrogène. • Plusieurs formules empiriques permettent de calculer la valeur de la température de fusion. Elles tiennent compte du pourcentage de bases (G+C), la taille de la molécule, de la salinité du milieu ainsi que de divers facteurs correctifs, tels que la présence de structures secondaires intra ou extra moléculaires (repliement de l’ADN sur lui-même, formation d’appariements entre deux brins). • Calcul du Tm: Oligonucléotide inférieur à 20nt : Tm = (A+T)x2 + (G+C)x4 Oligonucléotide supérieur à 20nt : Tm =[ (A+T)x2 + (G+C)x4] x (1+{(N-20)/20}) Polynucléotide supérieur à 100nt : Tm = 81,5 + 16,6(log10[Na+]) + 0,41[(G+C)/N] – (600/N) 16 Renaturation de l’ADN La dénaturation est un processus réversible et la reformation de la double hélice d’ADN peut se faire même lorsque les deux brins ont été totalement séparés. Ce processus, appelé renaturation ou réassociation se produit si la température ou le pH sont diminués. Si le changement de température ou de pH est graduel, les deux brins s’alignent correctement et reforment toutes les paires de bases originelles. Cette propriété est également employée dans les techniques d’hybridation nucléaire avec les sondes d’acide nucléiques (southern blot pour l’ADN et northern blot pour l’ARN…). Hybridation = Association spontanée, spécifique et réversible de deux brins d’ADN complémentaires. – spécifique : une séquence d’ADN monobrin ne peut s’apparier qu’à la séquence qui lui est complémentaire dans le génome. – réversible : En jouant sur les conditions expérimentales (température) on peut entraîner ou briser (dissociation) l’hybridation de deux molécules d’ADN. Les ARN présentent plusieurs caractéristiques propres et qui les opposent à l'ADN : - Ils sont plus courts : (70 à 10000 nucléotides). - Le sucre : le ribose (à la place du 2’-désoxyribose présent dans les ADN). Les bases pyrimidiques et puriques qui sont A, C, G et U. L’uracile (U) remplace donc la thymine (T) présent dans l'ADN; Une seule chaîne nucléotidique au lieu de deux dans les ADN. On dit que les ARN sont monocaténaire (ou simple brin), (exception : certains virus possèdent un ARN bicaténaire). Cette unique chaîne est plus courte que les chaînes d’ADN. Structures secondaires : dans une même chaîne d’ARN des portions peuvent être sous forme bicaténaire (ou double brin) avec un appariement suivant la règle : A apparié avec U (deux liaisons hydrogène) et C apparié avec G (trois liaisons hydrogène). Dès lors, au niveau des appariements. on aura la constitution de sortes de tiges et des boucles. 17 Boucle Epingle à cheveux a- Les ARN messager (ou ARNm) : • Les ARN messagers constituent le support essentiel de l’information génétique entre l’ADN et le ribosome où s’effectuera la synthèse protéique. • Les ARNm sont très rapidement synthétisés et dégradés, leur durée de vie est très courte. • Ils sont formés d’une seule chaîne de nucléotides avec les bases communes aux ARN : A, U, C et G. Cette chaîne comporte une succession de triplets nucléotidiques. Chaque triplet nucléotidique constitue un codon. codon 18 b- Les ARN de transfert (ou ARNt) : Les ARNt présentent la structure générale des ARN, mais ils possèdent en plus quelques particularités propres : certaines portions de la séquence nucléotidique s'apparient entre elles pour former un ARN double brin. En structure spatiale, on présente souvent les ARNt sous forme de trèfle. c- Les ARN ribosomiques (ou ARNr) : Les ribosomes sont des organites intra-cellulaires situés dans le cytoplasme et qui sont l’usine de fabrication des protéines de la cellule (voir la partie du cours sur la traduction). Les ARNr jouent un rôle essentiel dans la structure et le maintien de l’intégrité des ribosomes en association avec les protéines ribosomales. 19 Caryotype : ensemble des chromosomes d'un individu classés par paires d'homologues, par morphologie identique, par la place du centromère, par bandes identiques (sombres/claires) et par ordre décroissant de taille. Les chromosomes ont des tailles et des formes variées, avec des caractéristiques qui permettent aux cytogénéticiens de les identifier Les chromosomes = structures filiformes qui contiennent l’ADN . 1 Chromosome = 1 molécule d’ADN Un chromosome non mitotique correspond à une chromatide. Les chromosomes se dupliquent lors de la phase S du cycle cellulaire avant d’entrer en mitose. Un chromosome mitotique donne deux chromosomes identiques attachés l’un à l’autre au niveau du centromère. Lors de la mitose, les chromosomes se condensent et sont inactifs sur le plan transcriptionnel (les gènes ne s’expriment pas, sauf ceux des histones). Si l’on considère les molécules d’ADN humain porté par les 46 chromosomes: représente l’équivalent de 3.109 paires de bases. Le plus grand chr. = 85 mm (85000 µm) Or, cette molécule d’ADN rentre dans un noyau cellulaire de quelques µmètres (6 µm). 20 Chaque molécule d’ADN présente différents niveaux d'enroulement et de compaction. compaction Dans le noyau des cellules eucaryote, l’ADN n’est pas nu, il est associé à d’autres constituants pour constituer la chromatine. La chromatine est constituée de : l’ADN l’ADN, des ARN ARN, d’une classe bien définie de protéines appelée : les histones histones, ainsi que de nombreuses autres protéines. protéines Euchromatine : claire, décompactée et active (riche en gènes transcrits). Hétérochromatine : dense, compacte, inactive sur le plan transcriptionnel. les dernières à se répliquer lors de la phase S. L’hétérochromatine facultative - L’état de condensation de la chromatine change d’une cellule à une autre et d’un moment à un autre. Elle peut passer à l’état de l’euchromatine. L’hétérochromatine constitutive - Ne se décondense pas durant l’interphase et qui se situe dans les régions juxta-centromériques de tous les chromosomes chez presque toutes les espèces, mais parfois dans d’autres régions aussi, par exemple sur le chromosome Y. - Fonction inconnue. 21 Portion de la double hélice d’ADN Enroulement en ‘chapelet de perles’ de la chromatine (une ‘perle’=un nucléosome Surenroulement en hélice nucléosomes empilés : solénoïde Le solénoïde forme des boucles qui se fixent à l’armature centrale. L’armature et les boucles s’organisent en un superenroulement géant. La compaction est maximale dans le chromosome métaphasique : chaque molécule d’ADN et 50000 fois plus courte. Le nucléosome : L’unité structurale de base de la chromatine est constituée de petites boules de 100 Å de diamètre appelées : Nucléosome. Les nucléosomes sont reliés entre eux par une séquence d’ADN : l’ADN linker. Un nucléosome est formé de : 8 histones (2 fois : H2a, H2b, H3 et H4) autour duquel s’enroule une portion d’ADN double brin de 146 paires de bases et qui est répété indéfiniment, donnant un aspect en “ chapelet de perles ” à la fibre de chromatine d’environ 11 nm d’épaisseur. 22 Solénoïde Les protéines histones : • Protéines de petit poids moléculaire (11-14 kDa), riches en acides aminés basiques. • Elles ont un rôle de protection de l’ADN vis-à-vis des enzymes qui le dégradent. • Elles permettent aussi l’accessibilité du grand et de petit sillon de l’ADN, lieu d’interaction : ADN-facteurs de transcription. • Très conservées. • Au niveau des extrémités NH2 et COOH, on trouve deux bras riches en acides aminés basiques (Lysine et Arginine). Ces régions sont chargées positivement, ce qui permet d’interagir avec les charges négatives des groupements phosphates des molécules d’ADN. 23 Chromosome humain en métaphase après élimination des histones. Notion du gène ♦ Le mot gène, introduit par W. Johannsen en 1910 = une hypothétique unité d’information qui contrôle la transmission héréditaire d’un trait distinctif chez un organisme particulier. Gène = d'acide désoxyribonucléique, constituant une unité physique et fonctionnelle, qui mène à la formation d’un produit spécifique et fonctionnel du gène qui peut être soit une molécule d’ARN, soit une protéine. Unité de transcription Un gène englobe: • les nucléotides spécifiant la protéine (c'est-à-dire la région codantes) ou un ARN fonctionnel (ARNr ou ARNt), • et toutes les séquences d'ADN nécessaires à la formation du transcrit primaire. 24 1- Les gènes procaryotes * Généralement, des régions codantes non interrompues. Promoteur 1- Les gènes procaryotes : gènes polycistroniques • Les gènes codant pour des enzymes contribuant à une fonction commune sont d'habitude groupés sur le chromosome bactérien; • Exemple: les cinq gènes codant les enzymes nécessaires à la synthèse de tryptophane à partir de petites molécules précurseur se trouvent serrés sur un morceau de 7 kb du génome de E. coli. • Les gènes de cet amas forment une seule unité de transcription appelée opéron. • Une seule mutation peut influencer l'expression de plusieurs protéines. 25 2- Les gènes eucaryotes Eléments de contrôle proximaux Promoteur Unité de transcription Le promoteur : Les séquences minimales exigées pour une initiation de la transcription correcte. C’est l'emplacement où se lie l'ensemble de l'appareil de transcription et de ses facteurs accessoires pour ouvrir l'ADN et initier la transcription 26 Région régulatrice : Les éléments de séquence qui déterminent la fréquence d’initiation de la transcription ; ceci comprend les séquences responsables de l’inductibilité et de la répressibilité de la transcription et de la spécificité cellulaire, tissulaire et temporelle de la transcription. Parmi celles-ci, il y a les éléments activateurs ou amplificateurs (Enhancers) et les éléments modérateurs (Silencers). L’unité de transcription : constituée par le segment d’ADN continu codant pour la séquence du transcrit primaire ; ceci inclut : 1. les exons, c’est la séquence codante de l’ARN mature (ARNm, ARNt, ou ARNr..) ou de la protéine produite 2. les introns 3. les séquences leader 5’ (5’ UTR) la queue 3’ (3’UTR). 27 2- Les gènes des eucaryotes Modifications post-transcriptionnelles : Coiffe : Me-G-ppp-5’ Excision - épissage Queue poly-A Modifications post-transcriptionnelles : Coiffe : Me-G-ppp-5’ Une enzyme ajoute un nucléotide à Guanine sur les phosphates du Carbone 5’ du premier nucléotide du transcrit et transfère des radicaux méthyle sur les premiers nucléotides. Ces modifications font un début commun à tous les transcrits primaires précurseurs des RNA messagers. 28 Modifications post-transcriptionnelles : Excision - épissage : les parties non codantes de la structure primaire du transcrit sont coupées et les parties codantes rassemblées Après l’excision des introns et l’épissage des exons, le messager ne contient plus que les exons réunis en une seule séquence codante. Modifications post-transcriptionnelles : ARNm mature Queue poly-A Une enzyme coupe le transcrit environ 10 à 20 nucléotides au delà de la séquence AAUAAA et synthétise sur le Carbone 3’ libre du dernier nucléotide du transcrit restant une longue chaîne de 500 à 2000 nucléotides à Adénine polycondensés. 29 Organisation des génomes Structure des génomes Tailles comparées de différents génomes: Les tailles des génomes sont données en paire de nucléotides par génomes haploïdes. 30 Le paradoxe de la valeur C La valeur C = la quantité d’ADN dans un génome haploïde. Cette valeur est de 3. 109 pb pour le génome humain. • Si on compare la valeur C de différentes espèces, on devrait s’attendre à ce qu’elle augmente en fonction de la complexité d’un organisme. • Certaines amibes ont un génome 200 fois plus grand que celui de l’homme. Il y a donc beaucoup plus d’ADN que prévu. Il y a donc un paradoxe. Taille du génome Nbre de gènes (nucléotides) (protein-coding) Amoeba dubia ~ 670 000 000 000 ? Psilotum nudum ~ 250 000 000 000 ? Fritillaria assyriaca ~ 100 000 000 000 ? Necturus lewisi ~100 000 000 000 ? Homo sapiens 3.2 3. 200 000 000 30 000 Vitis vinifera 487 000 000 30 400 Drosophila melanogaster 160 000 000 14 000 Arabidopsis thaliana 115 000 000 28 000 Caenorhabditis elegans 98 000 000 19 400 Saccharomyces cerevisiae 12 500 000 5 800 4 600 000 4 300 Escherichia coli 31 • E. coli possède environ 4,300 gènes, pour un génome de 4.6 x 106 pb l’homme 30,000 gènes, pour un génome de 3 x 109 pb. Donc le génome humain est environ 600x plus grand, mais ne contient qu’environ 5 fois plus de gènes. Donc le génome humain est environ 600x plus grand, mais ne contient qu’environ 5 fois plus de gènes. 32 Génome humain 3100 Mb Gènes et séquences de gènes Gènes (Exons) ADN intergénique Séquences apparentées Répétitions intercalées Pseudogènes Autres régions intergéniques LINES Fragments de gènes Microsatellites SINES Introns, UTRs Divers Eléments LTR Transposons ADN Types de séquences dans un génome Pour comprendre comment on évalue la complexité du génome, on a considère deux propriétés très importantes de la double hélice : - la possibilité de se séparer en deux brins élémentaires lorsqu’ on chauffe progressivement la solution d’ADN, c’est la dénaturation, - la possibilité des molécules d’ADN monocaténaires complémentaires de se réassocier lorsque la solution est refroidie lentement. C’est la renaturation. Facteurs influencent la vitesse de renaturation d’une préparation d’ADN 1) 2) 3) 4) 5) la force ionique de la solution. +++ la température. la concentration d’ADN. la durée d’incubation. la taille des molécules qui interagissent. 33 Expérience : Dénaturer puis à réassocier une molécule d’ADN dont l’appariement des bases est parfait. Si on a un grand génome, il faut au préalable casser mécaniquement l’ADN en fragments de quelques milliers de paires de bases pour favoriser l’association. Ce procédé est exécuté par les ultrasons. • Concentration de l’ADN et temps : notion de Cot et de Rot. L’hybridation des séquences nucléiques est aléatoire. Cependant, si la concentration de l’ADN est grande, le nombre de copies hybridées sera grand. Il en résulte donc que la vitesse d’hybridation augmente lorsque la concentration de l’ADN augmente. la probabilité d’association des brins complémentaires est importante lorsque le temps est long. L’hybridation est quantifiée en fonction de ces deux variables prises ensembles : C0 et t Pour le cas des ADN, cette variable est nommée le Cot, Pour le cas des hybrides ADN/ARN, elle est dite le Rot : C0 = concentration initiale en DNA monocaténaire au temps 0 ( mol de nucléotide/l) T = temps exprimé en secondes 34 courbe cot Méthode d’estimation de l’hétérogénéité des séquences d’une préparation d’ADN, basée sur l’observation que plus l’ADN est homogène et plus facilement (plus rapidement) la réassociation d’un ADN simple brin peut se produire. La courbe de cot représente la concentration en ADN double brin en fonction du produit de la concentration totale en ADN par le temps d’incubation. Cot (1/2) : Le cot (produit de la concentration initiale et du temps) auquel la moitié de l’ADN a été renaturé est le demi-cot, un paramètre indiquant le degré d’hétérogénéité d’un mélange complexe et l’étendue de la complémentarité, dans un mélange de deux molécules, d’ADN simple brin. Complexité des génomes viraux et bactériens Cot 1/2 (E. Coli) = 9 mol.s/l, Cot 1/2 (T4) = 0,3 mol.s/l. Le DNA d’E. Coli se réassocie environ 30 fois plus lentement que celui du phage T4. La raison de cette différence est due au fait que le génome E. Coli est plus grand que celui du phage T4 35 Complexité des génomes eucaryotes Trois types d'ADN différents : le premier type se renature très rapidement, le second se renature nettement plus lentement, le troisième il ne se renature que très lentement. Interprétation 1. L'ADN qui se renature rapidement n'a aucun mal à retrouver un brin qui lui soit complémentaire parce qu'il contient une (ou des) séquence très fréquente. 2. Le second se renature nettement plus lentement. 3 2 1 3. Le troisième type a beaucoup de mal à retrouver son complément parce que cette séquence est " unique ". L’hybridation moléculaire va permettre de mettre en évidence l’existence de séquences hautement répétées et moyennement répétées, et de séquences uniques dans les génomes d’eucaryotes. 36 Séquences uniques Génome humain 3100 Mb Gènes et séquences de gènes Gènes (Exons) ADN modérément répété (voir cours S5-génét.molé.) ADN intergénique Séquences apparentées Répétitions intercalées Pseudogènes LINES Fragments de gènes SINES Introns, UTRs ADN fortement répété (5 – 300 pb) (105 copies) Autres régions intergéniques Familles de gènes (Histones, ARNt..) Microsatellites Minisatellites Satellites Divers Eléments LTR Transposons ADN 37