- Traduction Google
-
Google Traduction
Logo de Google TraductionURL http://translate.google.com/ Type de site Traduction automatique Inscription Non Propriétaire Google État actuel Bêta modifier Google Traduction (en anglais : Google Translate) est un service fourni par Google Inc qui permet de traduire un texte ou une page Web dans une autre langue.
Contrairement à d'autres services de traduction comme Babel Fish, AOL et Yahoo qui utilisent SYSTRAN, Google utilise son propre logiciel de traduction.
Sommaire
Fonctions
Le service comprend également une traduction de pages Web, où une longue page Web, même contenant plusieurs milliers de mots, peut être traduite. La navigation entre pages Web en traduction est assurée, avec des limites.
Google Translate, comme les autres outils de traduction automatique, a ses limites. S'il peut aider le lecteur à comprendre le contenu général d'un texte en langue étrangère, il ne permet pas de fournir des traductions précises. Par exemple, il traduit souvent des mots hors contexte et ne permet pas d'appliquer une grammaire fiable. Franz-Josef Och a confirmé ce fait lors de son discours au Sommet de 2005.
Approche
Google Translate est basé sur une méthode appelée traduction automatique statistique, et plus spécifiquement, sur les recherches de Franz-Josef Och qui a remporté le DARPA concours pour la vitesse de traduction automatique en 2003. Och est maintenant chargé du département de traduction automatique de Google.
Selon Och[1], une base solide pour l'élaboration d'une statistique utilisable consisterait à avoir un corpus de textes (ou texte parallèle) bilingue de plus d'un million de mots et deux corpus unilingues de plus d'un milliard de mots chacun. Les statistiques modèles à partir de ces données servent ensuite à traduire les différentes langues.
Pour acquérir cette énorme quantité de données linguistiques, Google utilise les documents correspondants de l'Organisation des Nations Unies. Le même document est normalement disponible dans les six langues officielles de l'ONU, ce qui permet maintenant à Google hectalingual d'avoir un corpus de 20 milliards de mots.
La disponibilité de l'arabe et du chinois comme langues officielles de l'ONU est probablement une des raisons pour laquelle Google Translate a d'abord concentré ses efforts sur le développement de la traduction entre l'anglais et les autres langues, et non pas, par exemple, sur le japonais ou l'allemand, qui ne sont pas des langues officielles de l'ONU.
Les représentants de Google ont été très actifs à des conférences nationales au Japon et ont persuadé des chercheurs de leur fournir des corpus bilingues. Google a été un commanditaire officiel de la Computational Linguistics annuel à la conférence Gengoshorigakkai au Japon en 2007. Google a également envoyé un délégué à la réunion des membres de la Société de linguistique informatique du Japon en mars 2005, promettant un financement pour les chercheurs qui seraient disposés à partager des données texte.
Logos
Logo jusqu'à mai 2009
Options
(par ordre chronologique)
- Début
- 4e étape
- 7e étape (lancé février 2007)
- 8e étape (lancé octobre 2007)
- L'ensemble des 25 paires de langues d'utilisation de Google en matière de système de traduction automatique
- 10e étape (à partir de ce stade, la traduction peut être faite entre les deux langues)
- 11e étape (lancé le 25 septembre 2008)
Notes et références
- ↑ Discours-programme au Sommet de la traduction automatique 2005
- (en) Cet article est partiellement ou en totalité issu d’une traduction de l’article de Wikipédia en anglais intitulé « Google Translate ». (dans sa première version et à titre de curiosité historique, cet article a été traduit par Google Translate, le 27.07.2008)
Voir aussi
Liens externes
Catégories : Google | Traduction | Traitement automatique du langage naturel
Wikimedia Foundation. 2010.