
qu’on peut analyser et de les propager chez les bactéries ou les levures sous forme de 
chromosomes artificiels portant plusieurs centaines de milliers de nucléotides. 
Malheureusement, dans ces banques, ces fragments ne sont plus ordonnés, et il faut donc 
rétablir leur origine chromosomique de façon à obtenir un ensemble de fragments 
indépendants et identifiés individuellement, qui recouvre la totalité du génome : c’est ce 
qu’on appelle la carte physique du génome.On recherche pour ce faire les zones de 
chevauchement entre les différents fragments de la banque, ce qui permet de les ordonner les 
uns par rapport aux autres. Les marqueurs moléculaires utilisés pour la carte génétique 
peuvent être localisés sur la carte physique et permettent d’identifier les fragments 
chevauchants correspondant aux différents chromosomes. On peut en procédant de cette 
manière établir une correspondance entre la carte physique et la carte génétique, ce qui permet 
de passer d’une localisation sur la carte génétique à une région d’ADN et vice versa. 
Il faut noter que les deux cartes – génétique et physique – sont loin de donner la même 
représentation du génome : si la carte génétique s’appuie sur le mécanisme biologique de la 
recombinaison, la carte physique correspond à la molécule d’ADN. Deux gènes très proches 
sur la molécule d’ADN (carte physique) peuvent apparaître éloignés sur la carte génétique s’il 
y a beaucoup d’événements de recombinaison entre eux. L’intégration des deux types de 
cartes permet d’isoler les gènes responsables des caractères étudiés, étape nécessaire pour 
avancer dans la compréhension de leur fonction. 
• Le séquençage 
Les techniques de séquençage enzymatique sont apparues dès les années 1970. Elles sont de 
nos jours réalisées de façon automatique par des robots de séquençage. Ces machines 
permettent d’atteindre un débit compatible avec le séquençage de génomes entiers.  
1.2. Bioinformatique 
Un des problèmes soulevés par les programmes de génomique est l’augmentation sans 
précédent des volumes de données biologiques à traiter. Il s’agit de stocker ces données dans 
de larges bases de données informatiques, de permettre à tous les biologistes d’y accéder de 
façon simple et rapide, de les analyser et les comparer entre elles, souvent en développant des 
outils mathématiques et informatiques appropriés. C’est le domaine de la bioinformatique, 
nécessaire aux programmes de génomique qu'elle soit structurale ou fonctionnelle. 
A partir des données de séquençage, il est généralement difficile de reconnaître les gènes, 
souvent morcelés dans le génome. L’informatique peut apporter une aide précieuse pour 
identifier et reconstituer les gènes codant pour des protéines. Des programmes informatiques 
élaborés à partir des connaissances obtenues sur des milliers de gènes permettent de prédire la 
localisation des parties codantes des gènes et donc d’apporter une aide précieuse pour 
l’identification des gènes codant pour telle ou telle protéine. La comparaison automatique de 
séquence, permet également de rechercher dans l’énorme masse de données existante les 
gènes qui présentent des ressemblances avec une séquence étudiée, que ce soit dans le même 
organisme ou dans toute autre espèce. De 50 à 60% des gènes d’Arabidopsis impliqués dans 
la synthèse des protéines sont retrouvés dans d’autres organismes comme la levure de 
boulanger, la mouche du vinaigre ou l’homme, reflétant des fonctions très conservées dans 
tous les être vivants. Si on connaît déjà la fonction biologique de ces gènes similaires, on peut 
souvent proposer un rôle pour les gènes étudiés, rôle que l’on pourra essayer de confirmer de 
façon expérimentale. Le traitement informatique peut également faire connaître dans la 
séquence des modules de structure ou de fonction connue, qui peuvent renseigner le biologiste 
par exemple sur la régulation de l’expression du gène ou sur la localisation de la protéine dans 
la cellule. 
1.3. Génomique fonctionnelle 
La génomique structurale et le séquençage permettent de dresser un inventaire de la totalité 
des gènes de l’organisme. L’analyse bioinformatique permet d’établir des classifications et 
 2