Compte rendu rapide d’utilisation de TELEGRAPH, Globalink – Congrès S.A.E.S. de Nice, mai 1997– Atelier N.T. – Alain Cazade - 4/4
Mais : On eût aimé une règle permettant de traiter billion comme une catégorie (unité) et ses prédicats de manière
générique. Cela est peut-être possible mais non documenté par le logiciel. (voir exemples de règles donnés
= limités et particularisés, non génériques !)
- Si j’entre : « billion men » (et non plus : billion people), cela ne marche plus !
On peut également essayer d’adapter le dictionnaire et essayer de faire fonctionner « billion » comme « hundred ».
Après recherche sur « hundred », il se trouve que seuls les cas de 1 à 9 ont été répertoriés, ainsi : nine hundred
people neuf cents personnes mais eleven hundred people (…) onze cent personnes. Si je veux faire pareil
avec x billion people, la liste des quantificateurs possibles sera vraiment trop longue !
Résultat final un peu décevant après l’entrée de la règle vue plus haut et les modification précédentes:
At the Cairo conference of 1994, pessimistic biologists declared that the ten billion people expected to live on
earth in 2050 will use up (strain) water, soil and many resources and cause environmental catastrophes,
hunger and misery.
A la conférence Le Caire de 1994, les biologistes pessimistes ont déclaré que les dix milliards d'habitants
censé vivre sur terre en 2050 épuiseront (tension) eau, sol et beaucoup de ressources et cause
catastrophes de l'environnement, faim et misère.
- Problème avec l’accord au pluriel de censé (déclaré pourtant comme adj.). Le nom cause peut être déclaré
comme verbe mais cela n’entraîne pas un lien par sujet commun avec « épuiseront ».
Conclusion :
- Un logiciel ouvert, qui peut devenir intelligent et aider à comprendre bien des problèmes de traduction, mais qui
demande une intelligence très « dévouée » pour le faire évoluer.
- Méthode d’analyse dite « globale » et non directe. On s’attendrait pourtant à une meilleure prise en compte de la
« motivation contextuelle » pour déjouer certaines erreurs grossières.
- Plutôt un peu plus lent que SYSTRAN. A l’évidence nettement plus lent si on passe par le mode interactif. Mais
la compréhension des problèmes posés se fait à ce prix.
- La base des dictionnaires ne pourra que s’enrichir, (version testée : 1.0 !) et beaucoup de difficultés devraient
facilement être résolues dans des versions ultérieures par des informaticiens dévoués ou zélés.
- Pas de mémorisation du travail en mode interactif fait précédemment. Si on recommence, on recommence à
zéro.
- On constate une tentative de régulation simplifiée – qui doit être intéressante à ce titre – des informations.
- Pas de choix de conjugaison possible, d’accords, genre, nombre, sujet-verbe, antécédence de relatifs etc. en
mode interactif. Il est vrai que le créneau de rentabilité de ce genre d’exigence est assez étroit. La possibilité de
pouvoir obtenir des règles plus générales (en envisageant des modèles plus fins pour catégoriser les types
d’ensembles à traduire…) fera(it) faire des progrès intéressants. Néanmoins, pour ne prendre qu’un exemple, on
pourra difficilement proposer à un utilisateur lambda de travailler sur des relations rendant compte des rôles
téliques, agentifs, constitutifs ou formels que l’on peut rechercher dans un composé binominal (cf. The Generative
Lexicon, James Pustejowski, MIT Press, 1995)… - pour ne citer qu’une facette des innombrables problèmes à envisager.
Il faut bien que de telles analyses soient déjà effectuées en amont pour que le produit puisse être utilisable, utile
et donc rentable dans tous les sens du terme.
Néanmoins :
- Une nouvelle sorte de logiciel d’aide à la traduction apparaît qui peut nous intéresser d’un point de vue
pédagogique. Même si les résultats actuellement obtenus sont encore nettement insuffisants, il semble que ce
type d’outil permette déjà d’entreprendre un travail intéressant avec des étudiants non spécialistes et peu
spontanément motivés (attrait du traitement automatique de données, de la technologie et d’une activité
interactive avec celle-ci) amenant à poser de véritables problèmes de fond. Les possibilités d’action réelle à la
fois sur le corpus d’items traités et sur les règles de traitement sons susceptibles de favoriser une meilleure
appropriation des données travaillées. Mais un problème de fonds existe dans le même temps, sauf si une
licence spéciale est prévue pour l’enseignement, ce qui ne serait pas étonnant.
Annexe: Petit récapitulatif :
Nota : qqs notations sur 10 par la revue informatique: PC Achat (jan 97) – qui ne mentionne pas SYSTRAN, ce qui est dommage.
Pobox 410 Watford Hertfordshire WD1 3XG U.K.
35, Cours Michelet, 92060 Paris
35, Cours Michelet, 92060 Paris
Apsydoc, Tour Franklin, La Défense 8
92042 La Défense Cedex
1, rue du Cimetière, 95230 Soisy / Montmorency
v. Classic, 3000F
v.Professional, 6000F