Les gènes : séquences d’ADN qui portent l’information qui sera exprimé ne sont pas contigus
dans la majorité, c’est à dire les gènes ne sont pas mis bout à bout donc on va définir des
régions gèniques et entre les gènes il y aura des régions intergèniques.
La majorité des gènes servent de support d’information pour la synthèse des protéines :
transcrit en ARNm traduit en protéine. Un certain nombre de gène jamais traduit en protéine :
ce sont les gènes transcrit pour former les ARNt qui jouent un rôle pour amener les acides
aminés au moment de la traduction. Les ARN ribosomaux qui ne seront pas traduit, resteront
en ARN, s’associent avec une protéine pour former les ribosomes donc la machinerie qui fait
la synthèse des protéines. Donc un gène n’est pas forcément traduit et peut s’arrêter au niveau
d’ADN donc.
La plupart des gènes qui vont codés pour des protéines sont des gènes en copie unique c’est à
dire que si on considère un génome haploide (moitié des chromosomes) ils seront présent à
une seule unité mais si diploide évidemment 2 copies. Donc la plupart des gènes qui donnent
les protéines : 2 copies par cellules alors que les gènes qui permettent de synthétiser les ARNt
et ARNr sont présents à l’état de multicopie c’est à dire qu’il y a plusieurs centaines de copies
de gènes pour ARNr parce qu’on a besoin de beaucoup d’ARNr. C’est aussi le cas pour des
protéines comme les histones qui ont un rôle dans le compactage de l’ADN : on a besoin
d’une telle quantité quand la cellule se divise qu’il faut assurer une production abondante en
peu de temps donc plusieurs gènes d’histones.
Si les gènes codant pour les ARNt (30) et ARNr (4 types de gènes pour 4 ARNr différents)
ont une taille assez constante par contre pour les ARNm il y a une très grande diversité c’est à
dire qu’on va avoir des gènes de petites tailles, des gènes plus grand (insuline 400pb), et des
gènes énormes comme par exemple pour le gène codant pour CFTR fait 250000 pb et celui
codant pour la dystrophine dont la modification entraine la myopathie de Duchens a un gène
énorme de 2400000pb. Donc palette énorme pour la taille des gènes qui sont le reflet de la
taille des protéines.
Chez les eucaryotes supérieurs (homme), les gènes sont organisés sous forme de mosaique. Si
on prends un gène donné, tout le message génétique ne sera pas retrouvé au niveau de la
protéine donc il y a aura eu un trie. Effectivement dans les gènes il y a des séquences
exprimées retrouvés au niveau des protéines, ce sont les exons et entre les exons il y a régions
éliminées au cours de l’expression : ce sont des introns.
Y a t’il des motifs qui définissent les frontières entre les exons, les introns ?
Les bornes : nucléotides situés à l’extremité d’un intron et au début de l’autre intron suivant
sont toujours les mêmes ce qui a permit de définir une borne accepteur qui commencera
toujours par A/G et un site donneur qui a toujours un G et un T. Et lorsqu’on a une séquence
d’ADN inconnue on fait des prédictions de présence d’introns et d’exons.
L’organisation en mosaique est très variable donc on peut pas prédir à l’avance combien il y
aura d’exons, combien il y aura d’exons, quelle sera la taille de ces exons, chaque gène est un
cas particulier. Le gène de l’interféron alpha fait 600pb et est formé par 1 seul exon et pas
d’intron, tout est exprimé mais il y a des systèmes plus complexes : le gène de la dystrophine
est divisé en 79 exons donc c’est une vrai petite mosaique très morcelée et ce nombre d’exons
n’est pas fonction de la taille car on connaît un gène d’un récepteur : la ryanodine qui est plus
petit que le gène de la dystrophine (700000pb) a 106 exons donc pas de prédictions possibles
en voyant la taille du gène.
Dans la bactérie il y a 6000 gènes, chez l’homme 30000 donc seulement 5 fois plus de gènes
mais pourtant 1000 fois plus d’ADN ce qui veut dire qu’il y a une organisation différente : en
particulier cette structuration exon intron qui allonge la taille du gène et il y a de très
nombreuses régions intergéniques c’est à dire des morceaux d’ADN qui n’ont pas
d’expression. Dans un génome humain : 30 % de cet ADN va être utilisé pour former les
gènes et dans ceux ci seulement ¼ va réellement être codant c’est à dire va être exprimé sous