Bio-informatique Un outil d’accélération du savoir Quels sont les gènes, quelles sont leur fonction ? Pour répondre à ces questions, l’informatique devient bioinformatique. Sans cette dernière, le séquençage du génome humain n’aurait pu se faire. A ujourd’hui, les chercheurs en biologie, du moins ceux qui étudient les gènes, passent plus de temps devant leur écran et sur Internet que devant leur microscope. Au terme d’une décennie d’intenses recherches, le séquençage du génome est mis à la libre disposition de la communauté scientifique sur Internet. Une surprise : l’homme possède moins de gènes que prévu, autour de 30 000, soit à peine deux fois plus qu’une mouche. N’empêche que la différence se fait par la complexité des protéines et par le grand nombre de variations (plus de deux millions identifiées) contenues dans le génome. Il faut ajouter que l’on ignore la fonction de 40 % des gènes. Ces changements, qui sont désignés sous le nom de polymorphismes nucléotidiques (SPN), distinguent les individus et jouent un rôle certain dans la prédisposition à certaines maladies. L’étape suivant celle du séquençage est donc la comparaison des codes génétiques individuels pour déterminer les séquences identifiant les gènes. Cette tâche est facilitée par des ordinateurs toujours plus puissants et des logiciels complexes. L’alliance de la biologie et de l’informatique donne cette discipline nouvelle, qui aiguise les appétits des investisseurs : la bio-informatique. Une discipline de recherche La bio-informatique est essentiellement une discipline de recherche. Elle permet d’accélérer les calculs et le développement rapide des médicaments issus de la recherche génétique. La première carte des polymorphismes du génome humain, qui vient d’être dévoilée, est la première pierre à l’ouverture d’un marché très convoité, celui des thérapies géniques sur lesquelles on fonde beaucoup d’espoirs. L’ordinateur doit gérer une masse de données énorme et la difficulté est aujourd’hui de pouvoir l’exploiter. La puissance des calculateurs est multipliée. Les concepteurs de logiciels ont fort à faire. Les annotations, c’està-dire l’interprétation des données, directement informatisées dans les bases, doivent l’être en langage naturel. En effet, l’objectif est de trouver un langage immédiat commun aux informaticiens et aux biologistes. Car c’est le vocabulaire, comme toujours en informatique, qui est le fondement de toute requête dans une base de données. Établir des programmes standards et modulaires ne sera pas facile quand on sait la masse énorme et très diversifiée des informations en génétique. Pour décrypter le génome, les biologistes utilisent des données qui viennent de tous les coins du monde et qui regroupent des millions de séquences d’ADN, venant de communications de diverses origines. Toutes les séquences sont comparées entre elles. Plus de quatre milliards d’éléments ont été identifiés et assemblés. Après le décryptage des fragments d’ADN, les chercheurs vont donc aborder l’assemblage des séquences. Pour pouvoir étudier ces millions de fragments d’ADN, les mettre bout à bout, essayer toutes les permutations possibles, les ordinateurs doivent comparer les séquences du début à la fin pour déterminer le rôle biologique de ces fragments utiles de l’ADN, c’est-à-dire les gènes. Les biologistes dénoncent déjà “l’approximation” des informations fournies par des logiciels qui devront eux-mêmes s’adapter à la diversité des demandes d’informations scientifiques donc exactes. La tâche est rude. D’autant que d’énormes efforts sont encore à faire dans l’orientation des recherches. Les laboratoires cherchant d’abord à rentabiliser le temps passé et l’argent dépensé, il est fort probable que les recherches seront d’abord concentrées sur des gènes simples, responsables de troubles spécifiques. Car les premières thérapies géniques seront commercialisées à des prix très élevés et, selon les analystes, les bénéfices ne seront réels que dans 20, voire 30 ans. Jean-Claude Julien Professions Santé Infirmier Infirmière - No 24 - mars 2001 45