1982 : Création d’une banque de données
1999 : 5,5 millions de séquences réalisées
2001 : 120 000 séquences par semaine soit un chiffre d’environ 15 millions de
séquences stockées
Des organismes modèles sont l’objet de plusieurs séquençages : Bactérie : E.
coli ; champignon : Saccharomyces cerevisiae ; nématode : Caenorhabditis elegans ;
insecte : Drosophila melanogaster ; plante : Arabidopsis thaliana et mammifère : Homo
sapiens.
Le traitement de l’information brute contenue dans une séquence réalisée
consiste en une annotation dont l’objectif est de :
-Prédire, le contenu en gènes, la position des gènes à l’intérieur d’un génome
(le début, la fin, et chez les eucaryotes, les introns et les exons), ainsi que
leur organisation (gènes uniques ou en opéron, avec des séquences promotrices, des
terminateurs, des sites de fixation ribosomaux (RBS) …). Il s’agit d’une annotation
structurale.
-Prédire la fonction potentielle de ces gènes (nom probable, fonction
probable et interactions probables), on parle d'annotation fonctionnelle.
III/ LE GENOME DANS LE MONDE VIVANT
Chez les virus, le génome est contenu soit dans une ou plusieurs molécules
d'ADN ou d'ARN, à simple ou double brin.
Chez les procaryotes (bactéries et archées), le génome est généralement
contenu dans une molécule d'ADN circulaire. Peut aussi exister un génome extra
chromosomique, contenu dans des plasmides et des épisomes.
Chez les eucaryotes, on distingue :
- Le génome nucléaire, contenu dans le noyau qui caractérise les
eucaryotes. C'est de ce génome dont on parle en général quand on parle du génome
d'un eucaryote (animal, plante, champignon, etc.) ;
- les génomes non-nucléaires, contenus dans des organites : le génome
mitochondrial, contenu dans les mitochondries, chez la quasi-totalité des eucaryotes
et le génome chloroplastique, contenu dans les chloroplastes, chez les algues et les
plantes supérieures. Chez quelques eucaryotes tels que la levure des plasmides de
taille réduite, peuvent également coexister.