Bulletin des BioTechnologies – Avril 2002
4
permettent le positionnement des sous-unités de la
transposase chaque site activant allostériquement la
transposase. Chaque sous-unité reconnaît un site sur
l'ADN et un site de clivage de l'autre côté de la
boucle. Un schéma clair est donné.
12.Lors de la Genome Tri-Conference du
Cambridge Healthtech Institute du 26 Février, Open
Channel Software et des chercheurs de Wayne State
University ont dévoilé leur nouveau logiciel
d'identification de fonctions qui est sensé corréler
automatiquement les données de microréseaux
d'expression avec des fonctions des gènes révélés. Il
s'agit de Onto-Express™.
Il permettrait de déterminer, à partir d'UniGene,
GenBank et Ensembl, la fonction structurale ou
régulatrice des protéines dont l'expression est
modifiée, leurs rôles connus dans une fonction
biologique, la localisation de leur activité dans les
cellules et la localisation chromosomique des gènes
identifiés en quelques minutes. Une version de base
gratuite est disponible à http://www.onto-express.org.
La version commerciale ajoute des algorithmes
permettant notamment d'indiquer l'indice de confiance
(p value) des résultats. PRNewswire (26FEB02).
Open Channel Software (OCS) est une organisation
Internet qui distribue des logiciels triés utiles aux
sciences de la vie.
13. Bien que l'on n'ait identifié qu'une quarantaine
de milliers de gènes chez l'homme, on estime qu'ils
codent probablement beaucoup plus de protéines et
cette dernière diversité est probablement la plus
importante. Il est donc difficile de dire qu'on a
identifié le gène d'une protéine. Les fonctions peuvent
être fort diverses, et il suffit parfois de peu de
modifications post-transcriptionnelles pour assurer
cette diversité, parfois sans qu'on puisse facilement
détecter ces légères différences. C'est ce que soutient
un commentaire de J Rappsilber et al.; Trends in
Biochemical Sciences 27 (FEB02) 74-78. La
spectrométrie de masse porte sur des peptides
relativement courts qui sont ensuite confrontés avec
des protéines connues de banques de données. La
technique de spectrométrie de masse, du fait qu'elle
fait largement intervenir les données de banques de
données peut fort bien ignorer les (ou des) isoformes.
Ceci permet de caractériser les protéines, puis de les
identifier à une fonction, les banques de données
remplissant les trous, mais ceci risque de faire passer à
côté de modifications fines non répertoriées, et donc
d'autres fonctions. Elle est capable d'identifier une
protéine, par recours à une banque, à partir d'un
peptide de 7 acides aminés qui est généralement
unique dans l'espèce humaine, par exemple. Par
conséquent plusieurs peptides permettent d'obtenir
une quasi-certitude. Ceci encourage à la paresse. Les
anticorps ont été largement utilisés dans
l'identification des protéines, mais l'idée qu'un gène
correspond à une protéine et donc à une fonction est
implicite dans ces procédés. Il y a donc une
insuffisance notoire de la protéomique sous ses
formes actuelles.
Il existe d'autres sources d'erreurs. Ainsi un
anticorps est dirigé contre un épitope limité de la
protéine dépend de l'organisation tridimensionnelle de
charges, et de l'hydrophilie ou hydrophobie de
l'épitope reconnu. Elle n'est pas toujours spécifique
d'une séquence (antigénicité croisée). C'est plus
particulièrement vrai pour les anticorps polyclonaux
qui sont, de fait, un mélange d'anticorps monoclonaux.
Inversement on peut les utiliser pour détecter des
homologues protéïques dans une espèce différente.
Le fait qu'un anticorps reconnaisse un motif donné fait
qu'il ignore une grande partie du reste. On a ainsi
détecté chez l'homme l'homologue d'un facteur
d'épissage de la levure en utilisant un anticorps
contre la sous unité p65 du facteur NF-kB qui
intervient, comme nous l'avons souvent vu, dans les
cascades de signaux chez les mammifères, donc avec
une toute autre fonction. Il faut donc beaucoup
d'autres données d'origines différentes pour trier les
résultats.
14. Une méthode de détection de la fixation de
protéines sur l'ADN en mesurant les changements de
charge sur l'ADN est décrite dans EM Boon et al.;
Nature Biotechnology 20 (MAR02) 282-286. Les
auteurs ont effectué la démonstration avec la protéine
se liant à la boîte TATA ou la méthylase HhaI ou
l'uracil DNA glycosylase, ainsi qu'une enzyme de
restriction face à son substrat méthylé ou non.
15. Les protéines kinases constituent une famille
étoffée (plus de 2000 d'entre elles sont connues). On
admet, par ailleurs, qu'au moins 30% des protéines
cellulaires ont une version phosphorylée. Il est,
cependant, difficile de localiser les sites de
phosphorylation et d'essayer d'en déduire les
domaines fonctionnels. On trouvera dans SB Ficarro
et al.; Nature Biotechnology 20 (MAR02) 301-305,
une technique pouvant permettre d'identifier, d'un seul
coup, toutes les protéines cellulaires phosphorylées
sans les isoler, ni les purifier.
On peut, par ailleurs, visualiser la phosphorylation
de protéines dans une seule cellule (M Sato et al.;
Nature Biotechnology 20 (MAR02) 287-294). On peut
ainsi visualiser les cascades de transduction de
signaux dans une cellule. On fusionne des versions de
la GFP (Green Fluorescent Protein) fluorescent
différemment avec un segment de liaison flexible
(linker) comprenant un domaine substrat de la kinase
à étudier, lié à un domaine reconnaissant sa version
phosphorylée. Le rapprochement des deux va modifier
la conformation générale et influer, ainsi, sur la
résonance de fluorescence entre les deux GFPs.
Des puces pour l'analyse quantitative de l'activité
des kinases sont, elles, décrites dans BT Houseman et
al.; Nature Biotechnology 20 (MAR02) 270-274. Elles
utilisent des peptides dont la phosphorylation est
détectée par SPR (Surface Plasmon Resonance, c'est à
dire un système de détection et de quantification basé
sur les changements de réfraction de la surface quand
la masse des peptides est modifiée), ou fluorescence.