Aucun titre de diapositive - Franco-Cité

publicité
LA SYNTHÈSE
DES PROTÉINES
La transcription
Information : dans le noyau (sous forme d'ADN)
Synthèse des protéines : dans le cytoplasme (au niveau
des ribosomes du reticulum endoplasmique)
L'ADN ne sort pas du noyau. L'information passe au
cytoplasme sous forme d'une copie : l'ARN.
ARN = Acide RiboNucléique
ARN diffère de l'ADN:
Sucre des nucléotides = ribose et non désoxyribose
comme dans l’ADN d’où le nom ARN, acide
ribonucléique.
Désoxyribose
Ribose
• La base azotée thymine (T)
remplacée par Uracyl (U)
(U peut s'apparier à A)
• Une seule chaîne de
nucléotides
• Molécules plus courtes et plus
instables que l'ADN
Certains segments de l’ARN peuvent
s’apparier s’ils sont complémentaires
Première étape de la synthèse d'une protéine = copie du
gène (ADN) en une molécule d'ARN = transcription
Ribonucléotides libres
3’
5’
5’
3’
Copie du gène en ARN = ARNm (ARN messager)
3’
5’
3’
5’
5’
3’
L'ARNm se détache et la molécule d'ADN se referme
Synthèse de l'ARNm se fait par l'enzyme ARN polymérase
Vitesse de la synthèse
~ 60 nucléotides / s
L’enzyme assemble le brin d’ARN
dans la direction 5’ – 3’ (comme
l’ADN polymérase)
ARN polymérase se fixe à l’ADN au niveau d’une courte
séquence d'ADN placée juste avant le début du gène
= promoteur
Le promoteur indique:
• Le début du gène à
transcrire en ARNm (où
l’ARN polymérase doit se
fixer sur l’ADN)
• Quel brin d’ADN doit être
transcrit
Le promoteur des eucaryotes contient
une séquence de nucléotides faite
uniquement des bases A et T.
TATA(A ou T)A(A ou T)A
Le plus souvent c’est la séquence
TATAAATA
Cette séquence est appelée TATA box
(elle est située sur le brin 5’-3’ à
environ 25 nucléotides avant le début
du gène).
Une protéine, appelée facteur de
transcription, reconnaît la TATA box et
s’y fixe. Il se forme alors un complexe
protéique par l’ajout d’autres
protéines dont l’ARN polymérase II qui
peut alors commencer son travail de
transcription du brin 3’-5’
Plusieurs ARN polymérases II
peuvent « travailler » en même
temps, les unes derrières les
autres, sur le même brin d’ADN.
Il peut donc se former plusieurs
copies d'ARN en même temps
Pouvez-vous expliquez ce
qu’on voit sur cette
illustration?
La traduction
La synthèse de la protéine (assemblage des acides
aminés) se fait au niveau des ribosomes
Les ribosomes
Plus petites structures cellulaires : visibles au
microscope électronique seulement.
Formés de deux sousunités: une petite et une
grande
(40 S et 60 S chez eucaryotes,
30 S et 50 S chez procaryotes).
Chaque unité formée d'un mélange d'ARN (= ARNr) et de
protéines (~ 60% ARNr et 40% protéines).
Les sous-unités sont synthétisées dans le ou les
nucléole(s) du noyau (les nucléoles sont des points plus
sombres visibles au microscope dans le noyau) .
Cellule
Noyau
Nucléole
30S
50 S
ARNr en brun; protéines en bleu
Unité 50S :
Formée de deux
ARNr et de 34
protéines
L'unité 30 S est
formée de 1 ARNr
et de 21 protéines
Unité 50S. Les protéines sont en jaune.
ARNr synthétisé comme l'ARNm à partir de gènes
spéciaux (ADN). Ces gènes existent en des
centaines de copies dans le génome.
Donc, certains gènes ne codent pas pour des
protéines. C’est le cas de ces gènes qui servent
à produire les ARNr
Pour synthétiser la protéine, il faut:
• ARNm = information (la recette)
• Ribosome = machine à assembler les acides aminés
• Acides aminés = pièces de construction
• ARNt (ARN de transfert) = molécules qui transportent
les acides aminés du cytoplasme au ribosome où ils
sont assemblés en protéine.
L'ARN de transfert (ARNt)
ARNt = brin d'ARN qui se
replie sur lui-même pour
former une structure en
3D
Deux zones importantes sur l'ARNt :
Extrémité 3' (se termine
par CCA) : peut se lier à
un acide aminé
N.B. certains nucléotides sont
exotiques (différents des 4
habituels). I, par exemple = "inosine"
un dérivé de l'adénine. I peut
s'apparier avec U, C ou A.
Anticodon = zone formée de
trois nucléotides pouvant se
lier à l'ARNm
Chaque ARNt est caractérisé par son anticodon.
Un ARNt ne transporte pas n'importe quel acide
aminé: ça dépend de l'anticodon
Ex.
ARNt AAA transporte toujours l'acide aminé PHE
ARNt GAU transporte toujours l'acide aminé LEU
L'acide aminé est attaché au bon ARNt par l'enzyme
aminoacyl-ARNt synthétase
Il existe plusieurs sortes
d’aminoacyl-ARNt synthétase.
Chacune peut attacher un acide
aminé particulier à un ARNt
particulier.
Le site actif de l’enzyme
reconnaît:
un acide aminé particulier
ET
un anticodon particulier.
L’enzyme unit l’acide aminé à
l’ARNt
Chaque ARNt est
synthétisé comme
l'ARNm à partir de
gènes spéciaux de
l'ADN (encore des
gènes qui ne codent pas
pour des protéines)
N.B.
• Un gène peut coder pour la synthèse d'une
protéine
• Un gène peut coder pour la synthèse d'un ARNr ou
ARNt (ces gènes existent en des milliers de copies
dans le génome)
DONC, gène = brin d'ADN qui est copié en ARN
Mécanisme de la traduction
Le brin d'ARNm s'attache au
ribosome.
En fait, il s’attache d’abord à la
petite unité. C’est à ce moment que
la grosse unité vient se fixer. Donc,
les deux unités ne s’assemblent
que lorsque l’ARNm se fixe à la
petite unité.
Deux ARNt peuvent se fixer par
leur anticodon sur l’ARNr au
niveau du ribosome (un sur la
zone appelée site P et l’autre sur la
zone appelée site A).
Liaison codonanticodon de deux
ARNt (il y a deux
sites de liaison sur
le ribosome).
L’ARNt à l’anticodon UAC se
fixe sur le codon AUG.
L’anticodon UGC se fixe sur le
codon ACG
Chaque ARNt se fixe par son anticodon sur trois
nucléotides de l’ARNm. Ces trois nucléotides de
l’ARNm constituent ce qu’on appelle un codon.
Après leur fixation, les acides aminés qu’ils
transportent sont reliés entre eux (le catalyseur
est constitué d’une partie de l’ARN du ribosome
et non d’une enzyme protéique).
Le ribosome avance de
trois unités
Le
premier
ARNt
est
retiré.
Un autre
ARNt se
met en
place
Vitesse de la synthèse:
• Chez E. coli ~ 5 AA / s
• Chez eucaryotes ~ 16 AA / s
Tous les ARNm se terminent par le codon (triplet de
bases) UAA, UAG ou UGA = codons STOP.
Lorsque le ribosome atteint un codon STOP, une
enzyme (facteur de terminaison) s'y fixe et détache
l'ARNm du ribosome.
==> le ribosome se sépare en deux
Les deux unités se réuniront à nouveau si
un ARNm se fixe à la petite unité.
Polypeptide
ARNm
Ribosome
La protéine synthétisée pénètre dans le reticulum
endoplasmique où elle prendra sa forme finale.
Chaque triplet de nucléotides
sur l'ADN correspond à un
codon de l'ARNm.
Chaque codon de l'ARNm
correspond à un anti-codon
spécifique de l'ARNt.
Chaque anti-codon correspond
à un acide aminé spécifique.
DONC: chaque triplet de
nucléotides sur l'ADN correspond
à un acide aminé.
Entrez une séquence
d’ADN et voyez
quelle protéine sera
synthétisée
Le segment d’ADN
5’ ...C T A...
3’ ...G A T...
3’
5’
code pour l’acide aminé
Leucine (Leu)
Mais doit-on écrire que c’est
5’ C T A 3’ qui code pour Leu ou
bien est-ce 3’ G A T 5’ ?
Par convention, c’est toujours le brin complémentaire au
brin transcrit qui est indiqué comme brin d’ADN codant.
Donc, dans ce cas, on dira que le brin codant (ou brin
sens) est 5’ C T A 3’ et le brin non codant (ou non sens)
est 3’ G A T 5’ . Sur ce site, par exemple, ou sur celui-ci,
c’est cette convention qui est utilisée.
La vitesse de synthèse peut être augmentée:
Plusieurs copies d'ARNm sont synthétisées à partir du
gène.
Un même ARNm peut se fixer à plusieurs ribosomes à la
fois = polyribosome
ARNm peut s'accumuler
dans la cellule sous forme
inactive
Découverte du code
Code déchiffré entre 1961 et 1964
Expériences de Nirenberg et Khorana (Nobel 68)
DONC: UUU = PHE
Par convention, le code
génétique est toujours
représenté en faisant
correspondre les codons
de l’ARNm aux acides
aminés auxquels ils
correspondent.
Le code génétique
Le codon AUG (code pour
MET) = codon d'initiation.
Tous les gènes
commencent par ce
codon. La MET est
souvent enlevée à la fin de
la synthèse.
Entrez une séquence et voyez la protéine codée :
http://library.thinkquest.org/3564/dna2protein.html
Code = UNIVERSEL ie. c'est le même pour tous les êtres
vivants sauf quelques rares exceptions:
Certains protistes : un seul codon STOP (UGA); les autres
codent pour un acide aminé.
Les mitochondries ont leur propre ADN et leurs propres
ribosomes qui sont plus petits (ressemblent à ceux des
procaryotes). Il peut y avoir jusqu'à 6 codons différents (5 chez
humains).
Cette caractéristique permet le transfert de gènes d'une
espèce à l'autre = génie génétique
• Introduction de gènes dans une bactérie
• Introduction de gènes dans un organisme
pluricellulaire
Ex. production d'insuline humaine par une bactérie :
On prélève le gène de l'insuline humaine et on l'introduit
dans le plasmide d'une bactérie.
On extrait les plasmides
de bactéries
Une enzyme de
restriction ouvre les
plasmides
On extrait ou on
synthétise le
gène à greffer et
on le multiplie en
de nombreux
exemplaires.
On mélange des copies
du gène et des
plasmides. Une
enzyme (ligase)
fusionne les brins
d'ADN
Les plasmides sont
réintroduits dans des
bactéries
Le gène est
reproduit quand la
bactérie se reproduit
Exemples: bactéries qui synthétisent:
Insuline
Facteurs de coagulation
Hormone de croissance
Enzymes pouvant métaboliser certains polluants
(pétrole par exemple)
Protéines synthétiques qui n'existent pas dans la nature
ETC.
On peut aussi modifier les êtres pluricellulaires:
Végétaux:
Le gène est introduit dans une cellule du parenchyme
ou méristématique.
Cette cellule est multipliée en éprouvette pour former
un nouvel individu (cloning).
Animaux:
Le gène est introduit dans un ovule
fécondé ou une cellule
embryonnaire.
L'ovule est implanté dans l'utérus
d'une mère porteuse.
Plantes résistantes aux insectes.
Résistantes aux herbicides.
Résistantes au gel.
Fruits et légumes qui se conservent
plus longtemps.
Nouvelles saveurs.
Plantes plus riches en certains
éléments nutritifs (vitamines par
exemple).
ETC.
Riz possédant des
gènes lui permettant
de synthétiser du
bêta carotène, le
précurseur de la
vitamine A
Animaux à croissance plus
rapide.
Animaux plus faibles en gras.
Animaux plus productifs (en lait,
en viande, en œufs).
Production de protéines à
usage pharmaceutique
(insuline, par exemple).
ETC.
DANGERS ?????
Pour la santé?
Pour l'environnement ?
Ces saumons ont le même âge.
Celui du bas est un OGM
Thérapie génique: corriger les gènes défectueux en
introduisant dans les cellules le gène normal.
Problème : comment introduire le gène dans
chacune des cellules à corriger???
Le cloning
B
A
On extrait une cellule
ordinaire de la brebis A.
On extrait un ovule de
la brebis B.
Le noyau de l'ovule est
détruit et remplacé par le
noyau de la cellule de la
brebis A.
C
Clone de A
L'ovule avec son nouveau
noyau est implanté dans
une brebis C.
Qui donne alors naissance à
un jumeau identique (clone)
de A.
Dolly 1997-2003
N.B. Il a fallu dans le cas de Dolly
276 essais avant de réussir.
Peut-être un jour ???
Les mutations
Mutation = modification de l'information génétique (ADN)
Une mutation peut être:
• Chromosomique = altération d'un chromosome complet
• Ponctuelle = anomalie dans la séquence des
nucléotides
Cause des mutations:
Erreur lors de la séparation des chromosomes
(mutations chromosomiques) à la division cellulaire
Erreur de réplication (erreur de copie non réparée)
Erreur causée par une altération de l'ADN par des
agents extérieurs = agents mutagènes
• Causes physiques : radiations (UV, X, gamma)
• Causes chimiques : molécules agissant sur l'ADN
Goudron du tabac
Benzène
Aflatoxines de certaines moisissures
Radicaux libres
Types de mutations
• Substitutions
• Délétions
• Insertions
Substitution
Une paire de nucléotides remplacée par une autre.
Peut n'avoir aucun effet = mutation silencieuse
Ex. CCG (Gly) changé par CCA (Gly aussi)
http://library.thinkquest.org/3564/dna2protein.html
Ex. la chaîne ß de l'hémoglobine 145 AA)
Val-His-Leu-Thr-Pro-Glu-Lys-Ser-Ala-Val-Thr-Ala-Leu-Try-Gly-Lys-ValAsp-Val-Asp-Glu-Val-Gly-Gly-Glu-Ala-Leu-Gly-Arg-Leu-Leu-Val-Val-TyrPro-Try-Thr-Glu-Arg-Phé-Phé-Glu-Ser-Phé-Gly-Asp-Leu-Ser-Thr-Pro-AspAla-Val-Met-Gly-Asp-Pro-Lys-Val-Lys-Ala-His-Gly-Lys-Lys-Val-Leu-GlyAla-Phé-Ser-Asp-Gly-Leu-Ala-His-Leu-Asp-Asp-Leu-Lys-Gly-Thr-Phé-AlaThr-Leu-Ser-Glu-Leu-His-Cys-Asp-Lys-Leu-His-Val-Asp-Pro-Glu-Asp-PhéArg-Leu-Leu-Gly-Asp-Val-Leu-Val-Cys-Val-Leu-Ala-His-His-Phé-Gly-LysGlu-Phé-Thr-Pro-Pro-Val-Glu-Ala-Ala-Tyr-Glu-Lys-Val-Val-Ala-Gly-ValAla-Asp-Ala-Leu-Ala-His-Lys-Tyr-His
Anémie falciforme = maladie génétique caractérisée par
une hémoglobine anormale.
Anomalie dans la chaîne ß de l'hémoglobine : 6e acide
aminé = VAL alors qu'il devrait être GLU
Quels codons codent pour VAL ?
Code
Quels codons codent pour GLU ?
GUU
GUG
GUC
GUA
GAA
GAG
Quelle mutation peut avoir changer Glu par Val?
GAA (CTT dans l’ADN) peut avoir été remplacé par GUA (CAT dans l’ADN)
OU
GAG (CTC dans l’ADN) peut avoir été remplacé par GUG (CAC dans l’ADN)
Peut entraîner la modification d'un acide aminé de
la protéine.
• Parfois peu ou pas d'effet.
• Parfois diminue ou supprime l'efficacité de la
protéine.
• Rarement confère une nouvelle propriété (enzyme
plus efficace ou possédant de nouvelles
propriétés catalytiques par exemple).
Dans certains cas un codon devient un codon STOP
Ex. AAG devient UAG (STOP)
==> arrêt de la synthèse avant la fin = mutation non sens
Délétions ou insertions
= addition ou délétion d'une ou plusieurs paires de bases.
Effet désastreux: tous les acides aminés sont changés
SAUF si la modification fait intervenir un multiple de trois
nucléotides.
= mutation décalage du cadre de lecture (frame shift)
Rendez-vous au lien ci-dessous et voyez ce qui se
produit si on enlève ou on ajoute un nucléotide à une
séquence donnée.
http://library.thinkquest.org/3564/dna2protein.html
La mutation ne devient héréditaire que si elle se transmet à
la descendance, donc si elle survient dans un gamète ou
une cellule formant des gamètes.
Généralement les mutations provoquent un dérèglement
mortel de la cellule. Dans certains cas, c'est la reproduction
de la cellule qui se dérègle = CANCER
Structure des gènes chez les eucaryotes
Chez les procaryotes : presque tout l'ADN code pour des
protéines.
Chez les eucaryotes, seulement 3% de l'ADN code pour des
protéines ou des ARN r ou t.
Le 97% restant = "junk" DNA (ou "garbage" DNA)
Il serait plus prudent de parler plutôt d'ADN
non codant
Taille du génome en nombre de paires de bases
Nous savons depuis plus de 40 ans [Mirsky et Ris 1951,
cités dans Cavalier-Smith 1985a] que la taille des
génomes n'est pas en relation directe avec la complexité
d'un organisme, ni avec le nombre de ses gènes. Par
exemple, chez les eucaryotes unicellulaires, la taille des
génomes varie de 9 Mb (levure Saccharomyces
cerevisiae) à 700 000 Mb (amibe Amoeba dubia), soit un
rapport de presque 80 000. Parmi les seuls amphibiens,
la quantité d'ADN varie de 1 à 100; le crapaud Xenopus
laevis possède un génome approximativement de la
même taille que celui de l'homme (3400 Mb), 30 fois plus
petit que celui de la salamandre Necturus maculosus
(102 500 Mb) [Licht et Lowcock 1991]. A ce jour, chez les
vertébrés, les plus petits génomes connus sont ceux des
poissons actinoptérygiens tétraodontiformes (400 à 500
Mb) [Pizon et al. 1984], le plus grand celui du poisson
dipneuste Protopterus aethiopicus (147 000 Mb) (fig. I.3)
[pour revue, voir Cavalier-Smith 1985a,b, Olmo et al.
1989]. Ainsi, des organismes de degré de complexité
similaires possèdent des génomes dont les tailles sont
extrêmement différentes.
http://biomserv.univ-lyon1.fr/txtdoc/THESES/DURET/RTFToC1
Contrairement à la taille des génomes, le nombre de gènes codant pour
des protéines semble être corrélé (grossièrement) avec le degré de
complexité de l'organisme [Cavalier-Smith 1985b]. Parmi les
eucaryotes, le nombre de gènes protéiques varie d'environ 7000 chez la
levure [calculé à partir de Dujon et al. 1994], à 100 000 au maximum
chez les mammifères [Fields et al. 1994]. Cette variation d'un facteur 15
du nombre de gènes protéiques est nettement insuffisante pour
expliquer la variation d'un facteur 300 de la taille des génomes de ces
organismes. Les autres unités fonctionnelles (gènes d'ARN
structuraux, origines de réplication, sites de recombinaison, etc. - voir
définitions plus loin) ne contribuent pas significativement à la taille du
génome. En définitive, l'essentiel des variations dans la taille des
génomes concerne de l'ADN dont on ne connaît pas la fonction. En
d'autres termes, une portion substantielle du génome eucaryote ne
contient pas d'information génétique. Chez les vertébrés, la quantité
d'ADN ne codant pas pour des protéines (ADN non-codant) représente
de 65 % (tétraodontiformes) à plus de 99,9 % du génome (Protopterus
aethiopicus) [calculé à partir de Cavalier-Smith 1985b].
http://biomserv.univ-lyon1.fr/txtdoc/THESES/DURET/RTFToC1
ADN non codant situé:
•
Entre les gènes codant
OU
•
À l'intérieur même des gènes = introns
ADN non codant formé de toutes sortes de choses:
Pseudogènes
Transposons
Minisatellites
Rétrotransposons
Satellites
Microsatellites
À lire :
Chromosome 8,
l’intérêt personnel
Les introns
Introns = séquence non codantes situées à l'intérieur des
gènes
Parties codantes = exons
90% de certains gènes = introns
Ex. gène du collagène contient 50 introns!
Taille des introns varie de 31 à 210 000 bases
Lors de la transcription, tout le gène (introns + exons) est
copié en ARNm.
L'ARNm doit ensuite être modifié pour, entre autres, en
enlever les introns = épissage de l'ARN.
Chez les vertébrés,
la longueur
moyenne de l'unité
de transcription est
environ 5 à 10 kb,
dont 75-80%
d'introns [CavalierSmith 1985b, Smith
1988][9], mais les
gènes de 100 à 200
kb contenant moins
de 3% d'exon ne
sont pas rares.
Le record actuel est celui du gène DMD (dystrophine), responsable de la
myopathie de Duchenne, qui s'étend chez l'homme sur 2,5 Mb, dont 99,3%
d'introns.
http://biomserv.univlyon1.fr/txtdoc/THESES/DURET/TheseD.html#RTFToC1
Hybridation ARNm épissé avec le gène correspondant
d'ADN
L'ARNm subit aussi d'autres modifications:
• Ajout d'une forme modifiée de la guanosine à
l'extrémité 5' = coiffe 5' (protège contre les enzymes
hydrolytiques et sert de point d'attache au
ribosome).
• Ajout, à l'autre extrémité (3') d'une chaîne poly-A (30
à 500 nucléotides A) (protège aussi contre enzymes
hydrolytiques).
20% des maladies génétiques sont
dues à des erreurs d'épissage.
Dans certains cas, un même gène peut être épissé de
différentes façons pour donner différentes protéines.
Une protéine peut aussi être découpée, après sa
synthèse, de différentes façons pour donner différentes
protéines.
Il y aurait chez
l'humain entre de
30000 et 60000
gènes, mais plus de
100 000 protéines
différentes
Mais qu'est-ce
qu'un gène
?????
Combien de gènes ?
Selon les équipes qui ont séquencé l'ensemble du
génome humain il y aurait entre 30 000 et 40 000
gènes dans le génome humain.
Arabidopsis thaliana (une petite plante)
contient 25 000 gènes.
C. elegans (un nématode) en contient 19 000
La drosophile, 13 600
Arabidopsis thaliana
C. elegans
À lire: Quelle est la taille du génome humain
F
I
N
Téléchargement