grames), de longueur de 2 à 200, commençant et se terminant par l’une des 4 lettres (A, G, T,
C). Un programme, développé à l’aide du logiciel 4D par Joël Prince, permet de balayer un
génome de quelques millions de paires de bases en quelques minutes. Les nombres observés
sont comparés aux nombres calculés selon l’hypothèse nulle où les bi-grames résultent
d’associations aléatoires. Des analyses statistiques permettent d’élaguer les données brutes. Je
dégage ainsi de toutes les combinaisons de bi-grames possibles (2(4x4) –1) une propriété
générale : la fréquence des bi-grames observés oscille périodiquement selon une sinusoïde
amortie qui a un pas constant pour tous les génomes (10 liaisons phosphodiester) et une
amplitude très différente d’une espèce à l’autre. Cette valeur suggère immédiatement le pas de
la double hélice d'ADN. Il n'en est rien.
Je montrerai que l’amplitude des oscillations n’est due ni à la teneur en (G+C) des génomes,
ni à leur taille, ni à leur appartenance aux différents embranchements de l’arbre de la vie. Ce
dernier point est capital : les génomes aux très fortes oscillations peuvent appartenir aux trois
royaumes de l’évolution (archae, eubacteria, eucaria) ; il en est de même pour les génomes
aux oscillations très faibles. De plus, des ensembles de gènes homologues peuvent présenter
des oscillations très différentes. Je pense que les oscillations périodiques de l’ADN sont le
résultat du "style génomique des protéines" (3), concept selon lequel les protéines d’une
même origine et d’une même fonction auraient des structures différentes en raison des
propriétés globales du génome. Ce concept hétérodoxe, s’il était démontré, réfuterait l’un des
paradigmes de la biologie moléculaire et de la génomique structurale.
(1) Krzywicki A, Slonimski PP. (Long-distance correlations in the amino acid sequences of proteins) (article in
French). C R Acad Sci Hebd Seances Acad Sci D. 1966 Jan 24; 262 (4):515-8
Krzywicki A, Slonimski PP. Formal analysis of protein sequences. I. Specific long-range constraints in pair
associations of amino acids. J Theor Biol. 1967 Oct 17 (1):136-58.
(2) Ouzounis CA, Valencia A. Early bioinformatics: the birth of a discipline--a personal view. Bioinformatics.
2003 Nov 22;19 (17):2176-90
(3) Radomski JP, Slonimski PP. Genomic style of proteins: concepts, methods and analyses of ribosomal
proteins from 16 microbial species. FEMS Microbiol Rev. 2001 Aug 25 (4):425-35
Lire l'évolution dans les génomes : l'exemple des levures
Bernard Dujon, Membre de l'Académie des sciences
Université Pierre et Marie Curie et Institut Pasteur
Les génomes des organismes vivants contiennent l'intégralité des déterminants fonctionnels
qui permettent la vie et la reproduction des cellules et des organismes, les gènes, et de
nombreux autres éléments importants pour leur propagation et leur évolution et que l'on peut
maintenant identifier à partir des séquences génomiques. Les traces laissées par l'évolution
dans chaque génome sont souvent superposées, entremêlées et partiellement effacées, mais
l'analyse et la comparaison de différents génomes permettent, en les identifiant, d'en déduire
des informations précieuses sur les mécanismes moléculaires de cette évolution.
Avec les progrès rapides du séquençage des génomes (les séquences des premiers organismes,
dont la levure de boulangerie, Saccharomyces cerevisiae, ne datent que de dix ans), on peut
maintenant reconstituer, avec une précision grandissante, l'évolution des génomes de
différents groupes phylogénétiques d'organismes vivants. L'exemple des levures,
champignons unicellulaires, illustrera les principaux mécanismes identifiés dans l'évolution