Systran_cr

publicité
S Y S T R A N : Logiciel d’aide à la traduction
Compte rendu rapide d’utilisation – Pour le Congrès de la SAES – Nice 1997 – Atelier Technologies Nouvelles
Diffusé par MYSOFT
Prix : 3000F version Classic, 6000F version Professional
Matériel nécessaire : Windows 3.1x ou 95 ou NT, 8-16 Mo Ram, 15 Mo dd par couple de langues + (fichier
d’échanges – swap file - de 20 Mo)
Points faibles :
-
Le prix !
Définitions d’entrées de dictionnaires : trop limitées (volontairement, pour ne pas rebuter, et c’est au contraire un
point positif par rapport à d’autres critères que les nôtres)
Flexions non contrôlables.
Gestion de locutions lexicales : locutions nominales , adverbiales, prépositions (mots multiples)
Pas de véritable mode interactif (mêmes raisons de simplification) pour faire évoluer le logiciel et surtout
l’utilisateur…
Non intégré directement dans le traitement de textes.
De nombreuses propositions de traductions laissent perplexes.
Points forts :
-
très simple à utiliser.
Rapide.
Langues multiples.
Dictionnaires multiples, avec choix de priorités suivant contexte.
partageable en réseau.
mode traduction par lots (batches) sur version professionnelle.
Un des systèmes les plus anciens sur le marché, bénéficie d’une longue expérience. Mode d’analyse « direct » et non pas « global », cf. Telegraph).
Niveau de traduction meilleur que bien d’autres, voir les documents annexes. Malgré toutes les critiques qu’on
peut formuler, le résultat paraît utilisable car en bonne partie compréhensible, ce qui n’est pas le cas avec de
nombreux autres logiciels.
Exemple de traduction anglais  français :
Résultat sans manipulations :
Can more be better ?
Est-ce que plus peuvent être meilleurs?
At the Cairo conference of 1994, pessimistic biologists declared that
the ten billion men expected to live on earth in 2050 will use up (strain)
water, soil and many resources and cause environmental
catastrophes, hunger and misery .
Optimistic economists reply that free markets will make it possible to
adapt demand even to scarce commodities and that we will benefit
from substitutes that will by then have been discovered . Science will
also have achieved a successful green revolution. Pessimists forecast
that in 2030, the limited food supply of an Indian peasant today will be
considered normal in the whole world. Optimistic views predict on the
contrary that scarcity will increase prices and stimulate more food
production. However, in Japan, rice production has stopped
responding to progress in research concerning fertilizers since 1985.
Poor countries will see their population double (Pakistan) or triple
(Nigeria) by 2030, which may menace local economic development.
Though, the analysis of 40 years of data does not show that the former
necessarily causes the latter. It is clear now that increasing numbers
are no longer a source of prosperity, contrary to education and
training. It seems more prudent to try to maintain population growth to
lower rates than the current ones.
À la conférence du Caire de 1994, les biologistes pessimistes ont
déclaré que dix milliards d'hommes attendus vivre sur terre dans 2050
épuiseront l'eau (de contrainte), le sol et beaucoup de ressources et
causeront des catastrophes, la faim et la misère environnementales.
Les économistes optimistes répondent que les marchés libres
permettront pour adapter une demande même aux produits rares et que
nous tirerons bénéfice des produits de remplacement qui auront été
d'ici là découverts. La Science aura également réalisé une révolution
verte réussie.
Les pessimistes ont prévu que dans 2030, les
approvisionnements alimentaires limités en paysan indien aujourd'hui
seront considérés normaux dans le monde entier. Les vues optimistes
prévoient au contraire que la pénurie augmentera des prix et stimulera
plus de production de nourriture. Cependant, au Japon, la production
de riz a arrêté la réponse au progrès dans la recherche au sujet des
engrais depuis 1985. Les pays pauvres verront leur double de
population (Pakistan) ou tripleront (le Nigéria) par 2030, qui peuvent
menacer le développement économique local. Bien que, l'analyse de 40
ans de données ne prouve pas que l'ancien cause nécessairement le
dernier. Il est clair maintenant que les nombres croissants ne sont plus
une source de prospérité, contrairement à l'enseignement et à la
formation. Il semble plus prudent essayer de maintenir l'évolution de
population pour abaisser des taux que les courants.
(Septembre 26, 1994 De Temps:
POUVOIR DAVANTAGE =
MEILLEUR? Par Sharon Begley)
Résumé d’un article sur la Conférence du Caire de 1994
(Time Sept. 26, 1994 :CAN MORE = BETTER ?
By SHARON BEGLEY)
Quelques points (positifs et négatifs) à noter dans la première phrase:
À la conférence du Caire de 1994, les biologistes pessimistes ont déclaré que dix milliards d'hommes
attendus vivre sur terre dans 2050 épuiseront l'eau (de contrainte), le sol et beaucoup de ressources et
causeront des catastrophes, la faim et la misère environnementales.
+ reconnaissance du binôme NN « the Cairo conference », malgré le nom propre
+ gestion de l’article zéro et des accords d’adjectifs (les biologistes pessimistes)
Compte rendu rapide d’utilisation de SYSTRAN, Mysoft – Congrès S.A.E.S. de Nice, mai 1997– Atelier N.T. – Alain Cazade - 1/3
+ conjugaison correcte du verbe « ont déclaré », bon accord avec le sujet au pluriel,
+ identification de la conjonction that (pas un démonstratif),
+ bonne reconnaissance et du quantificateur dans le trinôme « ten billion men », bon enchaînement en aval :: « dix
milliards d’hommes » et bon accord au pluriel,
- « hommes attendus vivre sur terre » : mauvaise reconnaissance de la construction relative implicite avant
« expected » et du rôle de la préposition « to », attribuée à l’infinitif « to live » alors qu’elle introduit le complément
de « expected ».
- préposition : « in 2050 », « dans 2050 » et non pas « en », qui devrait être reconnaissable puisque devant une
date, exprimée en chiffres et non suivie de marques d’unités du type « ans », « années », « jours » etc. Idem avec
« dans 2030 » plus loin,
+ lexie verbale composée « use up » reconnue, conjugaison et accord au pluriel corrects, avec un sujet pourtant
éloigné (à - 8 mots),
- il est acceptable que la précision en apposition à la locution verbale « use up » : « strain » ne soit pas bien traitée :
elle est entre parenthèses.
+ reconnaissance des différents compléments de « épuiseront » et analyse compétente de la structure verbale de
« cause », en continuité avec « use up » et donc avec le même sujet et le même temps.
+ bonne reconnaissance de la détermination indéfinie devant « catastrophes » et définie devant « hunger » et
« misery ».
- difficulté stylistique d’intégration de la contruction prédicative avec « environmental » (correctement au pluriel) - le
résultat reste toutefois à peu près compréhensible,
Les économistes optimistes répondent que les marchés libres permettront pour adapter une demande même
aux produits rares et que nous tirerons bénéfice des produits de remplacement qui auront été d'ici là
découverts.
+ bonne performance générale, par rapport à ce que donnent d’autres logiciels, notamment pour ce qui est de la
conjugaison, des attributions d’accords en nombre.
+ - assez bon traitement de la difficulté posée par la construction verbale (délicate) : « make it possible to », mais la
construction prépositionnelle avec « to » (: : « pour ») pose problème.
- mauvais traitement de l’adverbe « even »
- bonne analyse de l’aire sémantique de « substitutes », ici « produits » et non « remplaçants ».
La Science aura également réalisé une révolution verte réussie. Les pessimistes ont prévu que dans 2030,
les approvisionnements alimentaires limités en paysan indien aujourd'hui seront considérés normaux dans le
monde entier.
+ « food supply » :: « approvisionnements alimentaires », choix judicieux du pluriel
- difficulté avec la préposition « of » dans « of an Indian peasant today » et donc avec le sens général de la
construction, mais bonne reconnaissance du rôle adjectival de « Indian » (précédé de « an » pourtant, mais - il est
vrai - suivi d’un nom).
Les vues optimistes prévoient au contraire que la pénurie augmentera des prix et stimulera plus de
production de nourriture. Cependant, au Japon, la production de riz a arrêté la réponse au progrès dans la
recherche au sujet des engrais depuis 1985. Les pays pauvres verront leur double de population (Pakistan)
ou tripleront (le Nigéria) par 2030, qui peuvent menacer le développement économique local.
-+ difficulté dans le traitement de la détermination du mot « prix » (article zéro !) mais compensée par la traduction
de « more food production » et de « rice production ».
- complémentation du verbe initial mal analysée dans la construction « stopped responding to progress », de même :
pour le choix très critiquable de « recherche au sujet », collocation très improbable.
- difficulté dans le discernement des classes possibles de « double » ; « triple », lui, n’est ni précédé ni suivi d’un
nom ; il est bien compris comme verbe, mais accordé et conjugué sans que soit reconnue sa fonction de
complémentation par rapport à « verront ».
- non reconnaissance de la construction prépositionnelle « by 2030 ».
Bien que, l'analyse de 40 ans de données ne prouve pas que l'ancien cause nécessairement le dernier.
- lexie composée discontinue « the latter … the former » non reconnue.
Il est clair maintenant que les nombres croissants ne sont plus une source de prospérité, contrairement à
l'enseignement et à la formation. Il semble plus prudent essayer de maintenir l'évolution de population pour
abaisser des taux que les courants.
+- compréhension globale correcte de « increasing numbers » mais choix de traduction discutable.
- difficulté avec la première particule « to » dans la construction délicate : « prudent to try to maintain », mais bon
traitement de la suivante.
- le verbe « maintenir » ne récupère pas tous ses compléments, de nouveau la préposition « to » pose problème et
entraîne même une confusion de classe par homographie avec « lower ».
Compte rendu rapide d’utilisation de SYSTRAN, Mysoft – Congrès S.A.E.S. de Nice, mai 1997– Atelier N.T. – Alain Cazade - 2/3
- le pronom « ones » dans la locution « current ones » n’est pas traité de manière satisfaisante. C’est typiquement
un cas où on a le sentiment qu’une approche globale, récursive ou par I.A. donnerait un meilleur résultat, mais cela
demanderait une appréciation du résultat atteint par référence à une base de données considérable, impensable
dans le cas d’une configuration de bureautique habituelle.
En essayant d’améliorer le processus de traduction, je note :
-
Aucune différence si je choisis comme « type de document » : aucun , journalisme ou résumé ( =?)
-
Avec ajout de dictionnaires spécialisés : Economie / Affaires, Sciences de la terre, Politique : seuls changements
notables : = éducation  enseignement ; croissance  évolution !
On regrettera, d’un point de vue pratique, quelques problèmes de sauts de lignes intempestifs ajoutés au texte
traduit récupéré. Il faut utiliser habilement les procédures de recherche/remplacement dans son traitement de textes
pour y remédier.
Possibilité de choix de type de dictionnaire (4 maxi) avec choix d’ordre de priorité
Aéronautique - espace Hydraulique
Médecine
Agroalimentaire
Informatique
Métallurgie
Automobile
Juridique
Militaire
Chimie
Langage familier
Naval
Économie - affaires
Mathématiques
Photographie - impression
Électronique
Mécanique
Choix du Type de document : (ou bien :
Résumé,
Correspondance (ence !),
Journalisme
aucun)
Nomenclature,
Compte-rendu de réunion,
Brevet
Physique - nucléaire
Politique
Sciences de la terre
Sciences de la vie
Textiles
Prose,
Langage parle – familier,
Guide d’utilisation.
-
Récupération et traitement possible des mots non reconnus dans la traduction (  ajout possible au
dictionnaire) – marqueur de mot inconnu au choix.
-
Création possible de dictionnaires personnels :
Types d’entrées :
- Anglais - français : nom, nom propre, adjectif, adverbe, verbe, verbe-nom-homographe, expression
- Français - anglais : Noun, proper noun, acronym, adjective, verb, expression, adverb
-
Format d’une entrée : élément source [ type ]  élément cible. (+ flexions, genre sauf si « groupe de mots »)
- Si on traite un groupe de mots, il faut traiter les différents composants et le mot principal. Il est précisé que le mot
principal doit être un nom !
- types de compositions proposées en anglais : n+n, adj+n – n+n+n, n+n+adj+n
- autres catégories de mots (préposition, conjonction etc.) autorisées si le mot principal est un nom.
- « lien source » à déterminer: pour former les pluriels
- Si la lexie « maître d’œuvre » est à traiter, il faut entrer « maître de œuvre » (le logiciel gérera les élisions
nécessaires avec l’article « de »)
- Groupes de verbes ou phrases complètes non encore admises (en préparation…) sous ce type de codage
simplifié.
- Une autre sorte de codage (plus fin, on s’en doutait) est accessible mais n’est pas documenté dans les documents
reçus.
EN CONCLUSION :
Un logiciel qui offre les meilleures performances parmi les logiciels qui ont été analysés (Power Translator Pro,
Telegraph, Transcend Expert et Systran). Mais naturellement, nous ne disposons malgré tout que d’une aide à la
traduction, ce qui est clairement accepté par les interlocuteurs de la maison d’édition avec qui j’ai pu parler. Il est
clair que pour le monde professionnel, un tel outil est le plus pratique. En revanche, on regrettera de ne pas pouvoir
entrer davantage dans le cœur de la « machine » pour tenter d’influer plus efficacement sur le processus de
traduction.
Compte rendu rapide d’utilisation de SYSTRAN, Mysoft – Congrès S.A.E.S. de Nice, mai 1997– Atelier N.T. – Alain Cazade - 3/3
Téléchargement