qu’on peut analyser et de les propager chez les bactéries ou les levures sous forme de
chromosomes artificiels portant plusieurs centaines de milliers de nucléotides.
Malheureusement, dans ces banques, ces fragments ne sont plus ordonnés, et il faut donc
rétablir leur origine chromosomique de façon à obtenir un ensemble de fragments
indépendants et identifiés individuellement, qui recouvre la totalité du génome : c’est ce
qu’on appelle la carte physique du génome.On recherche pour ce faire les zones de
chevauchement entre les différents fragments de la banque, ce qui permet de les ordonner les
uns par rapport aux autres. Les marqueurs moléculaires utilisés pour la carte génétique
peuvent être localisés sur la carte physique et permettent d’identifier les fragments
chevauchants correspondant aux différents chromosomes. On peut en procédant de cette
manière établir une correspondance entre la carte physique et la carte génétique, ce qui permet
de passer d’une localisation sur la carte génétique à une région d’ADN et vice versa.
Il faut noter que les deux cartes – génétique et physique – sont loin de donner la même
représentation du génome : si la carte génétique s’appuie sur le mécanisme biologique de la
recombinaison, la carte physique correspond à la molécule d’ADN. Deux gènes très proches
sur la molécule d’ADN (carte physique) peuvent apparaître éloignés sur la carte génétique s’il
y a beaucoup d’événements de recombinaison entre eux. L’intégration des deux types de
cartes permet d’isoler les gènes responsables des caractères étudiés, étape nécessaire pour
avancer dans la compréhension de leur fonction.
• Le séquençage
Les techniques de séquençage enzymatique sont apparues dès les années 1970. Elles sont de
nos jours réalisées de façon automatique par des robots de séquençage. Ces machines
permettent d’atteindre un débit compatible avec le séquençage de génomes entiers.
1.2. Bioinformatique
Un des problèmes soulevés par les programmes de génomique est l’augmentation sans
précédent des volumes de données biologiques à traiter. Il s’agit de stocker ces données dans
de larges bases de données informatiques, de permettre à tous les biologistes d’y accéder de
façon simple et rapide, de les analyser et les comparer entre elles, souvent en développant des
outils mathématiques et informatiques appropriés. C’est le domaine de la bioinformatique,
nécessaire aux programmes de génomique qu'elle soit structurale ou fonctionnelle.
A partir des données de séquençage, il est généralement difficile de reconnaître les gènes,
souvent morcelés dans le génome. L’informatique peut apporter une aide précieuse pour
identifier et reconstituer les gènes codant pour des protéines. Des programmes informatiques
élaborés à partir des connaissances obtenues sur des milliers de gènes permettent de prédire la
localisation des parties codantes des gènes et donc d’apporter une aide précieuse pour
l’identification des gènes codant pour telle ou telle protéine. La comparaison automatique de
séquence, permet également de rechercher dans l’énorme masse de données existante les
gènes qui présentent des ressemblances avec une séquence étudiée, que ce soit dans le même
organisme ou dans toute autre espèce. De 50 à 60% des gènes d’Arabidopsis impliqués dans
la synthèse des protéines sont retrouvés dans d’autres organismes comme la levure de
boulanger, la mouche du vinaigre ou l’homme, reflétant des fonctions très conservées dans
tous les être vivants. Si on connaît déjà la fonction biologique de ces gènes similaires, on peut
souvent proposer un rôle pour les gènes étudiés, rôle que l’on pourra essayer de confirmer de
façon expérimentale. Le traitement informatique peut également faire connaître dans la
séquence des modules de structure ou de fonction connue, qui peuvent renseigner le biologiste
par exemple sur la régulation de l’expression du gène ou sur la localisation de la protéine dans
la cellule.
1.3. Génomique fonctionnelle
La génomique structurale et le séquençage permettent de dresser un inventaire de la totalité
des gènes de l’organisme. L’analyse bioinformatique permet d’établir des classifications et
2