Mercredi 9 octobre ABECASSIS Anna L2 GM Pr Beroud 16

publicité
GM- Support de l'information génétique ; structure et fonction du génome
Mercredi 9 octobre
ABECASSIS Anna L2
GM
Pr Beroud
16 pages
Support de l'information génétique ; structure et fonction du génome
Plan
A. Des gènes aux protéines
I. Structure de l'ADN
II. Structure des gènes
III. Expression des gènes : transcription et traduction
IV. Régulation de l'expression des gènes
1. Différents niveaux de régulation
2. Epigénétique
3. Empreinte génomique parentale
B. Le projet génome humain
1. De la structure d'ADN à la séquence du génome humain en 50 ans
2. Informations issues du projet
a)Structure
b) Variabilité
La génomique désigne tout ce qui concerne le génome. De la même manière, on peut utiliser le suffixe -omique
pour désigner le tout concernant un sujet :
- Transcriptomique (tous les transcrits) ;
- Protéomique (toutes les protéines) ;
- Métabolomique (tous les métabolismes) ;
- Lipidomique (tout ce qui concerne les lipides)... etc
A. Des gènes aux protéines
L’information génétique est contenue dans l’ADN : il existe plusieurs molécules d’ADN dans une cellule
humaine, elles sont localisées soit dans le noyau (chromosomes), soit dans les mitochondries (ADN circulaire).
Dans les mitochondries, la molécule d’ADN circulaire est de de 16 568 pb et a été séquencée en 1981.
Les molécules d’ADN nucléaire sont hyper compactées en chromosomes pendant la division cellulaire
(métaphase). Sur le schéma ci dessous, on peut voir les différents degrés de compaction de la chromatine, on
remarque que plus elle est compactée (moins elle est longue) et plus elle est large (c'est logique).
1/16
GM- Support de l'information génétique ; structure et fonction du génome
Le génome nucléaire est fragmenté en 23 paires de chromosomes.
Taille ≃ 3109 pb
Partie codante ≃ 3x107 pb (1%)
25 000 à 30 000 gènes
La chromatine est constituée par un assemblage de l’ADN avec des protéines histones.
8 histones sont nécessaires pour former un nucléosome.
L’ADN s’enroule autour des nucléosomes en formant une structure en collier de perles (ᴓ11nm).
L'histone H1 permet l’association des nucléosomes entre eux, leur compaction en fibre de chromatine de 30 nm
de diamètre. C'est l'unité de base de la chromatine.
On distingue l'hétérochromatine, dense et compactée (gènes inactifs et régions intergéniques) de
l'euchromatine, décondensée, qui contient les gènes actifs.
2/16
GM- Support de l'information génétique ; structure et fonction du génome
I. Structure de l'ADN
Le support de l'information génétique est l'ADN.
Le 25 avril 1953 paraît dans 'Nature' "A Structure for Deoxyribose Nucleic Acid" grâce à Crick, Watson et
Franklin.
L'ADN peut être :
– copié au travers des générations cellulaires successives : réplication ;
– traduit en protéines : transcription en ARN puis traduction en protéines ;
– réparé en cas de besoin : réparation.
Le support des gènes : l’ADN
II. Structure des gènes
Un gène est défini comme l’unité d’hérédité.
C'est une unité élémentaire d’ADN capable de se reproduire (réplication), susceptible de mutation et capable de
transmettre un message héréditaire.
Le gène permet la synthèse de 0, 1 ou plusieurs ARN et donc protéines.
Chez les eucaryotes les gènes sont morcelés:
- exons et introns transcrits ;
- séquences régulatrices non transcrites
3/16
GM- Support de l'information génétique ; structure et fonction du génome
Noter le site d'initiation de la transcription et le codon d'initiation de la traduction sur l'exon 1
Le promoteur :
Localisé en 5' du premier exon c'est à dire en amont.
Il est impliqué dans la transcription d'un gène en ARNm, il est reconnu par des facteurs de transcription, il est
composé des éléments suivants :
– TATA box (TATA AAA) en -35 à -20
– Initiator en +1
– CAAT Box en -200 à -70
– GC Box en -200 à – 70
A chaque région du promoteur correspond un facteur de transcription, par exemple pour la TATA box le facteur
de transcription est TBP (Tata Binding Protein).
Le promoteur de l'IL2 :
4/16
GM- Support de l'information génétique ; structure et fonction du génome
Les séquences régulatrices
* Enhancers : éléments de régulation positive localisés le plus souvent en amont des gènes.
* Silencers : éléments de régulation négative qui interagissent avec des répresseurs.
* Eléments mixtes enhancers/silencers : leur fonction dépend du ligand protéique ; la même protéine peut
jouer le rôle de enhancer ou silencer selon le ligand. Éléments E box (CACGTC)
liaison du dimère Max - Myc = enhancer
liaison du dimère Max - Mad = silencer
5/16
GM- Support de l'information génétique ; structure et fonction du génome
L'épissage des introns :
6/16
GM- Support de l'information génétique ; structure et fonction du génome
Il est dit alternatif.
Généralement un intron commence par GT ou GU et finit par AG.
Un intron possède un site donneur d'épissage (en fin de l'exon 1 et début de l'intron) et un site accepteur
d'épissage (en fin d'intron et début d'exon 2), ainsi qu'un point de branchement.
L'élément clé du point de branchement est une adénine (A).
L'épissage est un mécanisme complexe, réalisé grâce au splicéosome qui existe uniquement chez les
eucaryotes.
La snRNP U1 reconnaît spécifiquement le signal du site donneur tandis que la snRNP U2 reconnaît le point de
branchement : U1 et U2 se rapprochent et forment une boucle. Les 2 exons se rapprochent physiquement.
Ensuite interviennent U4, U5, U6, et des réactions chimiques brisent les liens ; il s'agit de deux trans
estérifications.
7/16
GM- Support de l'information génétique ; structure et fonction du génome
8/16
GM- Support de l'information génétique ; structure et fonction du génome
La queue poly A : Elle protège l'ARNm des dégradations. Elle est située en 3'.
Le signal de fin de transcription est également situé en 3'.
Les gènes ont une structure et une longueur variables.
Exemple : le gène de la titine possède 363 exons et son ADNc 101 518 pdb
le gène de Ubl4 possède 4 exons et son ADNc 2 382 pdb
Rappel : ADNc = copie de l'ARNm mature
Si on compare la structure des gènes entre les espèces :
– la taille des exons est conservée
– la taille des introns est variable
9/16
GM- Support de l'information génétique ; structure et fonction du génome
III. Expression des gènes : transcription et traduction
Attention, un gène ne code pas forcément pour une protéine. Il existe des gènes :
– uniques codant pour une protéine unique ;
– uniques codant pour plusieurs protéines (grâce à l'épissage alternatif) ;
– codant pour des ARN non traduits en protéines (ARN non codant) ;
– dispersés codant pour plusieurs protéines (familles et superfamilles de gènes) :
soit en cluster, proches les unes des autres sur un même chromosome,
soit sur différents chromosomes pour coder une protéine proche
– cas particuliers des gènes ribosomaux (ARNr) ;
– gènes ne codant pour aucune protéine, ni aucun ARN : on parle de pseudogènes, gènes un jour
dupliqués et la pression de sélection force la cellule à maintenir au moins un double des 2 copies actif
pour survivre.
La transcription :
C'est un processus dynamique continu, car il y a épissage pendant la transcription.
La maturation nécessite en plus le capping et la polyadénylation.
* Le capping :
Il se déroule en 3 étapes :
– une RNA triphosphatase hydrolyse le phosphate du triphosphate terminal de l'ARN laissant un ARN
terminé par une terminaison diphosphate et un Pi
– une RNA guanyltransférase assure le transfert de GMP sur l'extrémité 5' diphosphate de l'ARN.
– Une RNA méthyltransférase transfère le méthyl d'une S-adénosyl-méthionine sur le chapeau.
Concernant la transcription :
- la séquence du gène est sur le brin sens,
- l'ARN polymérase synthétise l'ARNm par complémentarité au brin antisens,
- au final, l'ARNm comporte la séquence du gène.
La traduction :
Le passage de la molécule d'ARNm à la protéine fait intervenir le code génétique. En effet, la séquence
nucléotidique dans l'ADN spécifie l'ordre des acides aminés (aa) dans la protéine.
Codon : séquence de 3 bases correspondant à 1 aa.
Le code génétique est dégénéré (redondant), non ambigu. AUG est un codon d'initiation de la traduction alors
que TAA, TAG, et TGA sont des codons STOP.
10/16
GM- Support de l'information génétique ; structure et fonction du génome
IV. Régulation de l'expression des gènes
Il existe 30 000 gènes mais 100 000 protéines différentes. On explique cela par les phénomènes de régulation de
l'expression.
1. Différents niveaux de régulation
–
–
–
–
–
Niveau chromatinien, ex:compaction de la chromatine ;
Niveau transcriptionnel, ex : effet des facteurs de transcription ;
Niveau post transcriptionnel, ex : modulation de la demi vie des messagers ;
Niveau traductionnel, ex : modification de facteurs d'initiation de la traduction ;
Niveau post traductionnel, ex : glycosylation, méthylation.
Ces niveaux de régulation interviennent au niveau de la séquence (contrairement à l'épigénétique).
2. Epigénétique
Ensemble des modifications de l'expression des gènes sans altération des séquences nucléotidiques, réversibles
et transmissibles d'une génération à l'autre. Ces mécanismes régulent l'équilibre entre gènes actifs et inactifs.
Les principaux mécanismes sont :
– Le code des histones (niveau chromatinien): en effet lors de modifications biochimiques des histones le
degré de compaction de la chromatine change. Or, on sait que seule la chromatine décondensée
correspond à une activation de la transcription.
–
–
La méthylation de l'ADN (niveau chromatinien) : elle est impliquée dans des phénomènes tels que la
compaction de l'ADN, l'inactivation de l'expression des gènes, l'inactivation du chromosome X, et dans
le phénomène d'empreinte génomique parentale.
Action de certains ARN non codants
3. Empreinte génomique parentale
C'est la non équivalence d'expression de certains gènes selon l'origine parentale. En effet pour la majorité des
gènes, la copie d'origine maternelle et la copie d'origine paternelle sont exprimés, mais pour certains gènes, seul
l'allèle maternel/paternel est exprimé.
11/16
GM- Support de l'information génétique ; structure et fonction du génome
B. Le projet génome humain
1. De la structure d'ADN à la séquence du génome humain en 50 ans
Le séquençage du génome humain a pour objectif de répondre aux questions suivantes :
- Le génome humain est plus complexe que celui des procaryotes, quelle est sa composition?
- Contient-il plus de gènes que celui des autres espèces?
- Comment expliquer les différences de niveau d’évolution?
- Plus une espèce est évoluée, plus elle a de gènes?
- Identifier les gènes responsables des maladies génétiques
- Placer les gènes sur les différents chromosomes
Le séquençage du génome humain est le plus grand projet scientifique mondial lancé en 88/89 et Human
Genome Project démarre en 90.
Capacités de séquençage :
en 1975, 1 000 nucléotides/semaines
en 1986, 10 000 / jour
en 1998, 200 000/ jour
Cartographie
– les cartes génétiques sont des cartes relatives où les distances sont exprimées en centimorgan (cM).
1 cM= 1% de recombinaison
– les cartes physiques sont des cartes absolues, plus précises que les cartes relatives, où les distances sont
exprimées en pdb.
Kilobases (kb)=1000pb
Mégabases (Mb)=1000kb
Chez l'homme, 1 cM= 1 Mb environ.
12/16
GM- Support de l'information génétique ; structure et fonction du génome
2. Informations issues du projet HGP
a)Structure
b) Variabilité
Le génome humain est composé de 3 272 millions de nucléotides.
Les régions riches en gènes sont les régions riches en nucléotides G et C.
Les régions pauvres en gènes sont riches en A et T.
Ces différentes régions peuvent être également visualisées comme des bandes claires ou sombres sur les
chromosomes métaphasiques (banding).
– bandes G : riches en AT, pauvres en gènes
– bandes R : riches en GC, riches en gènes
13/16
GM- Support de l'information génétique ; structure et fonction du génome
Les chromosomes étant classés par taille, le chromosome 1 contient le plus grand nombre de gènes estimés soit
environ 3000 alors que le chromosome Y en a le moins (231).
Le nombre total de gènes se situe entre 25 000 et 30 000.
La taille moyenne d'un gène est de 3 000 bases et 9 exons, mais la taille varie beaucoup (gène de la
dystrophine=2,4 millions bp)
99,9% de la séquence est identique entre deux personnes. Il existe donc 0,1% de différences soit 3,5 millions de
différences par génome.
Plus de 50% des gènes ont une fonction inconnue.
Le HGP a permis la création de bases de données de séquence et d'annotations, le séquençage de nombreux
organismes (animaux et même Néanderthal).
Aujourd'hui nous sommes face à une nouvelle ère, celle de la médecine personnalisée. Alors que pour le HGP,
on avait séquencé le génome humain pour 3 milliards de dollars on peut maintenant utiliser des séquenceurs à
haut débit qui fonctionnent en une semaine pour 10 000 dollars (seulement...) mais l'analyse des données reste
difficile.
Conclusion :
- Le génome humain est séquencé et séquençable.
- « ère post génomique »
- interaction des -omes (transcriptome, protéome, etc)
- le génome permet de mieux comprendre la diversité des êtres vivants (non expliqué par le seul nombre des
gènes)
- Médecine : bases génétiques des maladies causales (monofactorielles) ou à effet modificateur (prédisposition
génétique)
14/16
GM- Support de l'information génétique ; structure et fonction du génome
15/16
GM- Support de l'information génétique ; structure et fonction du génome
16/16
Téléchargement