- Traduction automatique
-
L'expression « traduction automatique » désigne au sens strict la traduction d'un texte (ou d'une conversation audio, en direct ou en différé) faite entièrement grâce à un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait à intervenir[1].
On englobe parfois également sous ce terme la traduction assistée par ordinateur où la traduction peut se faire en partie manuellement ou de façon interactive avec la machine.Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (Veille technologique y compris)[2], où elle permet de prendre connaissance de façon superficielle, mais rapide, de grandes quantités de textes.
Depuis quelques années, elle connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne pouvant traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C'est une aide très appréciée du grand public car elle permet de déchiffrer - de façon grossière - le thème d'une page Web dans une langue totalement inconnue, et les principaux faits ou éléments d'information qu'elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! permettent de l'utiliser.
Sommaire
Prérequis
Les pré-requis dépendent de l'approche envisagée : traduction à base de règles (mot-à-mot, transfert, pivot), traduction par l'exemple, traduction statistique.
La traduction automatique à base de règles nécessite :
- entrées de dictionnaires
- règles linguistiques
La traduction par l'exemple et la traduction statistique nécessitent :
- une mémoire de traduction (ensemble de textes traduits)
On peut, en plus, nécessiter des outils d'analyse linguistique tels que :
- tokéniseur
- étiqueteur morpho-syntaxique
- éventuellement : chunker, parser
Le processus de traduction
Article principal : Traduction.Le processus de traduction peut être découpé en étapes suivants:
- décoder la signification du texte source
- recodage du sens en langue cible
Difficultés
- Ambiguïtés de la langue source
- Ambiguïtés lexicales : polysémie. Dans Le défi des Langues, Claude Piron raconte que le 4 mai 1991 il avait demandé à une machine de traduire: In such a case, you can make a very good case for wooden cases, c'est-à-dire : « En pareil cas, on peut produire une argumentation très convaincante en faveur des caisses en bois », phrase qu'il avait déjà lue et simplement condensée. Au bout d'un instant vint la réponse: « Dans un tel cas vous pouvez faire un très bon cas pour des cas inexpressifs ».
- Ambiguïtés grammaticales : un même mot peut relever de deux catégories grammaticales différentes. Toujours dans Le Défi des Langues l'auteur proposait à une machine, mise en mode interactif, He was sorting out food rations and chewing gum, phrase qui peut signifier soit « il triait des rations et du chewing gum », soit « il triait des rations tout en mâchant du chewing-gum ». Au lieu de poser une question sur la valeur grammaticale du -ing dans chewing, au lieu donc d'« interagir », la machine livra la phrase suivante: « Il triait dehors rations de nourriture et mastiquant la gencive.»
- Ambiguïtés sémantiques : un même mot peut avoir plusieurs sens dans les contextes différents. Par exemple: «saw» qui peut signifier soit «voir», soit «scie».
- Ambiguïté de référence des pronoms : pour la phrase « Elle l'aime » qui peut signifier soit « She likes him/it »,soit « It likes him/it », etc.
- qu'il dispose, en plus de connaissances linguistiques, de connaissances factuelles sur l'état du monde (par exemple, il doit savoir que telle personne est de sexe féminin) ;
- qu'il soit capable de réaliser une certaine interprétation du texte qui lui est soumis : s'il rencontre le mot « secrétaire », il a besoin de savoir, selon la langue-cible, le sexe de ce/cette secrétaire ou de son employeur. Il est facile de résoudre cette difficulté dans le cas d'une phrase simple comme « John Doe's secretary » : une règle simple permet d'exprimer le fait que l'expression « X's Y » implique que Y "appartient" à X. Mais si le programme rencontre la phrase « je suis allé au service de la comptabilité et j'ai parlé au secrétaire », il est plus difficile pour la machine de faire la relation entre les secrétaires et le service qui vient d'être mentionné ; la tâche est encore plus ardue dans un contexte comme « j'ai vu M. Tartempion, qui m'a donné un document ; je suis allé au service de la comptabilité pour qu'ils en fassent une photocopie et je suis revenu le donner à la secrétaire » : ici, on ne peut même pas s'appuyer sur la proximité entre le mot « secrétaire » et le nom du service, puisqu'il est en fait question de la secrétaire de Tartempion, mentionnée bien avant dans la phrase.
Approches[3]
- Approche directe :
- traduction mot à mot du texte source vers le texte cible
- reformulation de l'ordre des mots traduits dans le texte cible
- Approche Interlangue :
- construction de la représentation interlangue du texte source
- construction du texte cible par la représentation
- Approche par transfert :
- analyse lexicale et syntaxique du texte source
- transfert des ? lexicale ? traduits et structures en langue cible
- Proposition : Approche séquentielle (ou progressive) :
- D'abord : Correction automatique du texte source (1 → 2)
- Ensuite : Détection pour interprétation (LSource → LCible -Trad-Mot-à-Mot → LSource) et remplacement des seules expressions idiomatiques dans le texte source (2 → 3)
- Ensuite : Détection pour Interprétation (LSource → LCible -Trad-Mot-à-Mot → LSource) et remplacement des seuls noms propres dans le texte source (3 → 4)
- Ensuite : Réorganisation syntaxique dans le texte source (4 → 5)
- Enfin : Traduction mot à mot du texte source (5 → texte cible)
Évolutions
Fin octobre 2005, la presse annonçait de notables améliorations[4]. Le Centre international pour les technologies avancées des communications, dirigé conjointement par l’université Carnegie Mellon de Pittsburgh et l' université de Karlsruhe en Allemagne, dévoilait alors un système informatique de traduction instantanée. Un étudiant chinois, affublé de onze électrodes sur le visage et sur la gorge, a prononcé dans sa langue un discours qui a été simultanément traduit en anglais et en espagnol. Les chercheurs indiquent en conclusion que « Les résultats ne sont pas parfaits » et qu' « il peut y avoir des difficultés quelquefois ». En fait aucun article n'indique que les journalistes allemands et américains aient pu discuter avec le Chinois. Les journalistes ont d’ailleurs généralement omis de préciser que, quand le docteur Waibel a annoncé qu’il allait prendre des questions de journalistes allemands et américains, l’ordinateur a entendu quelque chose comme : « Ainsi nous glycogène il alternant des questions entre l’Allemagne et l’Amérique. »[5]. Ce type de traduction demandera aussi des améliorations logicielle concernant la reconnaissance vocale, notamment brouillée par le bruit ambiant et la mauvaise prononciation.
Les appareils de traduction actuels sont utiles pour des situations limitées, par exemple pour réserver une chambre dans un hôtel. « Si je vais à Pékin, je peux descendre au Hilton sans aucun problème », disait Stephan Vogel, un chercheur de Carnegie Mellon.
Un projet abandonné : DLT
De 1979 à 1992, BSO, une firme néerlandaise a développé un projet nommé DLT (Traduction de langues distribuée) construit sur une « langue pivot » appelé ILO (Internacia LingvO dérivé de l'espéranto). Au lieu de prendre toutes les paires de langues possibles, DLT traduit systématiquement vers et de la langue pivot. Faute de financements, le projet a été abandonné sans être achevé.
Produits et services existants
Traducteurs en ligne gratuits : Ils permettent de traduire des mots ou des textes de taille limitée.
Langues généralement accessibles à la traduction : Allemand, Anglais, Espagnol, Français, Grec moderne, Italien, Néerlandais, Portugais.
On trouve aussi pour des traductions avec l'anglais : Arabe, Chinois traditionnel, Chinois simplifié, Coréen, Espéranto, Japonais, Russe, SuédoisLogiciels libres :
- GPLTrans
- Linguaphile
- Traduki
- Apertium
- GoldenDict
- Système METEO
Prospective
Divers projets cherchent à améliorer les performances et la rapidité des moteurs de traduction, espérant un jour pouvoir surmonter la barrière de la langue et traduire en temps réel (comme cela a été imaginé par de nombreux auteurs de science-fiction) une langue étrangère, voire pouvoir « communiquer » avec certains animaux via un logiciel de traitement vocal.
- Un projet en cours au Japon consiste à équiper un téléphone portable d'un traducteur multilingue automatique[6]. Ce projet vise dans un premier temps à afficher sur l'écran du téléphone la traduction de phrases et mots simples prononcées en Japonais ou en d'autres langues, en quelques secondes et de manière autonome, c'est-à-dire sans dépendre d'un serveur[7].
- Google a annoncé début 2010 une application de traduction vocale quasi-instantanée (speech-to-speech translation)[8]
Références
- traduction assistée par ordinateur où la traduction peut se faire en partie automatiquement et en partie de façon interactive avec la machine. Celle-ci pose alors des questions ou attend des précisions auxquelles ne peuvent répondre ceux qui ignorent tout de l'affaire. Il ne faut donc pas la confondre avec la
- Linguistique informatique, Traduction automatique : « Ils produisent souvent des traductions erronées mais qui peuvent au moins servir à déterminer de quoi parle le texte (ce qui est important en veille technologique, par exemple). » Laurence Danlos. Professeur de Linguistique Informatique à l'Université Paris 7, écrit dans
- Traduction automatique
- De nouveaux systèmes de traduction pour surmonter la barrière de la langue
- Une machine de traduction simultanée. L'information date du 31 octobre 2005 et, depuis, le projet semble en sommeil[réf. nécessaire].
- Brève d'ADIT-Japon sur la traduction automatique du japonais par un téléphone mobile (projet de NEC Corporation annoncé début 2009)
- Article de akihabaranews (description d'un essai au C&C iEXPO 09)
- Article, intitulé Google leaps language barrier with translator phone Google prépare une application (pour téléphone) de traduction vocale instantanée (Sunday Times du 2010/02/07, consulté 2010/02/11)
Voir aussi
Machine translation
Articles connexes
- Traduction de langues distribuée
- Traduction instantanée
- Traduction assistée par ordinateur
- Relecture assistée par ordinateur
- Cadre de balisage lexical
- Interlangue
- Mémoire de traduction
- Traduction aller-retour
- Architecture de transfert
Bibliographie
- Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Machine Translation: An Introductory Guide.
- Paul Bennett. 1994. Translation Units in Human and Machine. Babel 40:12-20.
- Bert Esselink. 1998. A practical guide to software localization. John Benjamins.
- Ethnologue. 2001. Languages of the World.
- W. John Hutchins & Harold L. Somers. 1992.An Introduction to Machine Translation. Academic Press.
- W.John Hutchins. 2001. Machine translation over fifty years. Histoire, Epistemologie, Langage XXII-1:7-31.
- Martin Kay. 1997. The Proper Place of Men and Machines in Language Translation. Machine Translation 13:3-23.
- Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins .
- Sergei Nirenburg. 1987. Machine Translation: Theoretical and Methodological Issues. Cambridge University Press.
- Johnatan Slocum. 1988. Machine Translation Systems. Cambridge University Press.
Liens externes
- Traduction automatique : les années où tout a changé, dossier Futura-sciences, 2008.
- La montée en puissance de la traduction automatique, Le Monde, 2010.
- La traduction automatique, NEF - Le Livre 010101 de Marie Lebert - Enquête, 2001.
Wikimedia Foundation. 2010.