Structure et organisatio des génomes

publicité
6- Structure et organisation des génomes
6-1 Génomes eucaryotes
Dans chaque cellule:
-génome nucléaire
-génome mitochondrial
(-génome chloroplastique)
6-1-1 Génomes nucléaires
6-1-1-1 Nombre d’exemplaires du génome par cellule
Organismes
. haploïdes : 1 exemplaire du génome par cellule. Courant chez les unicellulaires
. diploïdes : 2 exemplaires du génome par cellule, un hérité du père, un hérité de la mère. Les
2 exemplaires sont très similaires, mais pas strictement identiques. Très courant (cas de
l’homme)
. tétraploïdes: 4 exemplaires du génome. Rare chez les animaux, plus fréquent chez les
plantes
Certains organismes (ex: les levures) peuvent exister alternativement sous forme haploïde ou diploïde
En fonction du moment de sa vie (avant ou après division), la cellule aura ou pas dupliqué son génome,
pour ensuite transmettre une copie complète aux deux cellules filles. Donc, on peut trouver dans une
cellule diploïde 4 exemplaires du génome.
6-1-1-2 Structure des chromosomes
Le génome est réparti sur plusieurs molécules d’ADN linéaire.
Chaque molécule s’appelle un chromosome. Les chromosomes similaires issus du père et de
la mère s’appelle des chromosomes homologues
Pour être fonctionnel, un chromosome doit au moins contenir
-Une origine de réplication: L’origine de réplication permet l’initiation de la réplication. En fait, chaque chromosome en
contient plusieurs. Les deux séquences d’ADN identiques issues de la réplication s’appelle des chromatides. Selon que l’on
se place avant la réplication ou après la réplication, un chromosome contient une chromatide ou deux chromatides.
-Des télomères : La réplication ne peut jamais aller jusqu’aux bouts des chromosomes. Les télomères sont des séquences
répétées à l’extrémité des chromosomes, qui évitent une perte d’information génétique à chaque réplication.
-Un centromère: c’est une séquence plus ou moins centrale qui permet de maintenir associées les deux chromatides d’un
même chromosome et qui permet au chromosome de s’attacher au fuseau de division lors de la mitose, de façon à ce que
chaque chromatide soit transmise à une cellule fille.
- Les chromosomes peuvent être déployés dans la cellule et donc emmêlés. On parle de chromatine
-Lors de la division, les chromosomes se condensent en petites structures en bâtonnet, les chromosomes
proprement dit.
-L’ADN n’est pas nu dans le noyau mais associé à des protéines (dont les histones), que ce soit pour
former la chromatine ou les chromosomes
Empaquetage de l’ADN. Représentation schématique des
différents niveaux d’empaquetage de l’ADN pour former la
chromatine ou les chromosomes. Le premier niveau
d’empaquetage est assuré par une famille de protéines, les
histones (en jaune).
6-1-1-3 Taille des génomes
!
"
!
"
#
$%
&
"
#
#
'
(( ( &
$
%
'
#
)
))
&
&
)
( )
*
+
,
%&
( ## +
"
*
La taille des génomes varie d’une espèce à l’autre.
-Il n’y a pas de stricte proportionnalité entre taille du génome et degré d’évolution
-Il n’y a pas de stricte proportionnalité entre taille du génome et nombre de gènes. Les espèces à très grand génome
possèdent de très nombreuses séquences non codantes répétées.
6-1-1-4 Contenu des génomes
- Le génome contient des gènes et des séquences intergéniques
-Les gènes peuvent contenir des séquences non codantes
-La distribution des gènes sur un chromosome ou entre chromosomes semble être aléatoire.
Cependant . des gènes peuvent être regroupés pour une régulation d’expression coordonnée
. des régions chromosomiques sont plus pauvres en gènes que d’autres (ex: centromères)
-A, T, G et C ne sont pas équireprésentés: 59,7% de AT
. Les gènes sont plutôt riches en AT
. Les régions promotrices sont plutôt riches en GC
Comparaison d’un segment quelconque de 50 kb des génomes humain, de levure, de drosophile, de maïs et de la
bactérie Escherichia coli.
Plus les organismes sont simples, plus leur génome est « économe »:
- avec une plus grande densité de gènes et une moins grande densité de séquences répétées
- avec des gènes « simples » c’est-à-dire possédant peu ou pas d’introns.
Levure
Drosophile
Homme
Densité de gènes
(nombre moyen par Mb)
479
76
11
Introns par gène (moyenne)
0.04
3
9
% du génome occupé par des
répétitions
3.4%
12%
44%
Compaction des génomes de levure, de drosophile et d’homme
6-1-1-5 Gènes, familles de gènes
Gène
Gène
Gène
Séquence transcrite + promoteur/enhancers?
ADN
Transcription
ARN pol II
ARNm
ARNr
traduction
protéine
Transcription
ARN pol I
Transcription
ARN pol III
ARNt
5’
Gène
Gène
3’
ADN
5’
3’
5’
Gène
Gène
3’
ADN
3’
5’
-La très grande majorité des gènes sont présents en une copie par génome
haploïde
Dans les génomes diploïdes, chaque gène est donc présent en 2 copies.
Chaque copie s’appelle un allèle. Un allèle vient du père, un allèle vient de la
mère.
Généralement les deux allèles sont un peu différents: hétérozygote
Si les deux allèles sont strictement identiques: homozygote (reproduction
consanguine)
-Il y a quelques gènes répétés.
Ex:
. rRNA: 2000 copies par génome haploïde
. Histones
Ce sont des gènes dont les produits sont nécessaires en grande quantité
Gènes homologues: un certain pourcentage d’identité de séquence
Deux séquences d’ADN présentant 80% d’identité
Les nucléotides identiques dans les deux séquences sont repérés par un astérisque
Une identité en nucléotides ne se traduit pas nécessairement en une identité en acides aminés. Les nucléotides
identiques dans les deux séquences sont repérés par un astérisque. Les deux séquences nucléotidiques sont identiques à
76%. Cependant, quand les séquences sont traduites en acides aminés, l’identité décroit à 28%. Ces gènes, que l’on aurait pu
penser être homologues, ne le sont donc pas.
Deux catégories de gènes homologues:
-orthologues: de deux espèces différentes
. Leur identité de séquence suggère qu’il s’agit de deux versions d’un
même gène, ayant la même fonction dans deux espèces différentes
. Le minimum d’identité pour être orthologue dépend du degré
d’éloignement des espèces comparées
-paralogues: au sein d’une même espèce
.L’ensemble de ces gènes constitue une famille de gènes
.Les identités sont souvent concentrées dans des régions que l’on
appelle des boites d’homologies. Les boites d’homologie codent souvent
pour des domaines fonctionnels
.Des gènes paralogues peuvent avoir une même fonction (redondants)
ou des fonctions partiellement différentes
Liens phylogénétiques entre gènes orthologues et paralogues
de trois espèces descendants d’un ancêtre commun.
Protéines
totales
Ser/Thr/Tyr
kinase
Ser/Thr/Tyr
phosphatase
BRCT
SH3
VWA
WD40
C. elegans
19,100
435
112
26
58
65
127
S. cerevisiae
6,500
116
14
10
24
3
110
E. coli
4,289
3
1
1
1
4
0
B. subtilis
4,100
4
0
1
6
5
0
M.
tuberculosis
3,918
13
1
1
0
4
4
Synechocysti
s
3,169
12
0
1
3
4
2
A. fulgidus
2,420
4
0
0
0
2
0
M.
thermoautotro
phicum
1,869
4
0
0
0
2
0
M. jannaschii
1,715
4
2
0
0
3
0
A. aeolicus
1,522
2
0
1
0
1
0
Espèce
Expansion of de domaines rencontrés dans les kinases et les phosphatases depuis les organismes les plus évolués
jusqu’au moins évolués.
Set/Thr/tyr kinases et phosphatases sont des enzymes impliquées dans la transduction des signaux de l’environnement que reçoit
une cellule. Ces enzymes sont constituées par la combinatoire de 4 domaines, BRCT, SH3, VWa, WD40. Ces domaines
représentent eux aussi des familles dont le nombre de paralogues est indiqué. Ces enzymes sont donc présentes dans différentes
espèces sous forme de familles composés d’un nombre de paralogues variable selon l’espèce.
L’évolution semble passer principalement par une diversification au sein de grandes familles de protéines plutôt que par
l’acquisition de nouvelles familles
6-1-1-6 Pseudogènes et autres reliques de gènes
Pseudogène: copie non fonctionnelle d’un gène
Gènes tronqués
Fragments de gènes
Deux types de pseudogènes:
-Pseudogène conventionnel: devenu non fonctionnel à cause de mutations
-Pseusogène processé
Origine des pseudogènes processés. On pense que les pseudogènes processés proviennent de la réintégration dans le
génome d’un cDNA issu de la rétrotranscription d’un ARN issu de la transcription d’un gène normal. La réverse transcriptase
nécessaire est apportée lors d’un infection par un rétrovirus. L’intégration du pseudogène se fait au hasard. Le pseudogène est
donc dépourvu d’introns et surtout dépourvu de promoteur, ce qui le rend non fonctionnel.
6-1-1-7 Séquences répétées (non géniques)
Séquences non codantes, retrouvées à de nombreux endroits du génome.
4 types:
LINE (Long Interspersed Nuclear Element)
SINE (Short Interspersed Nuclear Element)
LTR (Long Terminal Repeat)
Transposons
Ce seraient des reliques de séquences virales installées dans les génomes eucaryotes, qui auraient
tellement muté qu’elles ne seraient plus capables de produire des particules virales, mais seraient
encore capables de se recopier et de se transposer ailleurs dans le génome.
,#
#+
-.
3 -.
(
(
#+
1(
#
3 -. 4
( #+
5
3 -. 4 (
371
&/ )$
2
###
8.1'
2
9&
2
(
'
#
&
'
=
/
& * $6
/ "$
/
;
#+
/
/ )$
2
:-2
9&
###
-
<
$
/
$
/! 0
/ !0
/
0
/ 0
/ )$
/
/ )0
/
/
/))0
/
/ *0
/*
/ "0
$
(
$
(
/!
&
&
(
6-1-1-8 L’ADN satellite
Motifs de séquence répétés en tandem
Ex:
GAGAGAGAGA….
TATTTATTTATTTATTTATT…
Seraient dus à un mauvais fonctionnement de la réplication: la polymérase patine.
'
& > > ($
# $ (
#'
#
#
α#
β#
# $ ( (
# &
!
$%&'
+
& )" *'
#&./
'
.
&
"
*
'
&
* *
# $ (
$
)" *
)" *
-
"
(
"
"
)
(
"
"
) ,, , , , ,
(
"
"
)"
1
-
"
##+
"
'
% &
> &
$
!
$
#
# $ (
+
+
#
,
0
* ,
2
#
#
&
&
"
"
" ,)
:
>&
8 &#+ #+
"
"
"
"
( ## &
&
## &
& ? >
"
"
$
"
-
6-1-1-9 Séquences non répétées non codantes
-promoteurs, enhancers…
-autres séquences
6-1-2 Organisation générale des génomes mitochondriaux et
chloroplastiques
Génomes de type bactérien:
-Le plus souvent circulaires
-Plusieurs molécules identiques par organite, nombre variable
-Pas d’introns dans les gènes
-Taille très variable selon la cellule hôte
-Nombre de gènes très variable selon la cellule hôte. Mais, le nombre de gènes
est toujours très inférieur au nombre de protéines constituant l’organite.
Beaucoup de gènes ont été transférés au génome nucléaire au cours de
l’évolution (100% pour les peroxysomes qui ont totalement perdu leur matériel
génétique).
Taille et contenu en gènes de génomes mitochondriaux de différentes espèces comparé au génome d’une
eubactérie actuelle, Rickettsia, l’agent du typhus.
(A) Les cercles et les traits représentent les génomes mitochondriaux circulaires et linéaires de différentes espèces. Pour
les génomes >60 kbp, l’ADN codant pour des gènes de fonction connue est indiqué en rouge, celui contenant des ORF
non identifiées et des séquences intergéniques non codantes est représenté en bleu.
Des comparaisons de séquences entre génomes mitochondriaux et génomes bactériens actuels indiquent une parenté des
mitochondries avec les Rickettsies, des bactéries parasites intracellulaires obligatoires. Ceci suggère que l’ancêtre des
rickettsies pourraient être à l’origine des mitochondries. Les homologies entre génomes mitochondriaux de différentes
espèces suggère que toutes les mitochondries, même d’espèces très différentes, descendent d’un unique ancêtre. La
colonisation symbiotique de la cellule eucaryote ancestrale par la bactérie à l’origine des mitochondries aurait donc été
un évènement unique, ayant eu lieu très précocement avant la divergence des différents règnes.
(B) Analyse des contenus en gènes de quelques génomes mitochondriaux. Chaque ovale contient le contenu en gènes d’un
génome mitochondrial d’une espèce donnée. Le génome mitochondrial de Reclinomonas (un protiste) est le plus grand
et contient tous les gènes que l’on retrouve dans des génomes mitochondriaux plus petits. Ce génome serait donc le
plus proche du génome ancestral, les autres ayant évolué principalement en transférant des gènes au génome
nucléaire.
6-2 Génomes procaryotes
6-2-1 eubactéries prototypiques, type E. Coli
-1 seul chromosome circulaire
. Contient presque exclusivement des gènes
. Nombreux gènes organisés en opéron
. Pas d’introns dans les gènes
. Moins de gènes que chez les eucaryotes
. Condensation pour former le nucléoïde par
. Supercoiling
. association avec des protéines HU, fonctionnellement similaires aux histones mais non
homologues en séquence. 1/5 seulement du chromosome est associé aux HU
- 1 ou plusieurs plasmides contenant des gènes de résistance aux antibiotiques
6-2 Génomes procaryotes
6-2-2 eubactéries non prototypiques
Quelques espèces ont
-un grand chromosome linéaire
-Plusieurs dizaines de petits chromosomes supplémentaires, linéaires ou circulaires
6-2 Génomes procaryotes
6-2-3 archebactéries
Organisation type E. coli
ou
-un grand chromosome linéaire
-plusieurs dizaines de petits chromosomes supplémentaires, linéaires ou circulaires
Possibilité d’introns dans les gènes
Protéines homologues aux histones
6-2 Génomes procaryotes
6-2-4 Evolution des génomes procaryotes
Les génomes procaryotes évoluent plus rapidement que les génomes eucaryotes
car
- Taux de mutation plus élevés
- Transferts horizontaux de gènes entre individus et même entre espèces (la notion
d’espèce chez les procaryotes est très floue)
Téléchargement