Universal Networking Language

Universal Networking Language

Le langage UNL est un langage formel informatique permettant de coder une représentation du sens d'un énoncé. On se sert de cette représentation comme d'un pivot interlingue dans des systèmes de traduction automatique ou d'un langage de représentation d'information dans des applications de recherche d'information.

Fondé à l'IAS (Institute of Advanced Studies) de l'Université des Nations unies à Tokyo en avril 1996, le projet UNL rassemble maintenant des partenaires du monde entier, avec plus de 14 langues couvertes.

Le but du projet UNL est de favoriser l'éclosion d'un véritable multilinguisme dans une société de l'information en pleine expansion. Nous souhaitons que cela permettra à toutes personnes de communiquer et d'accéder à l'ensemble des informations sur internet dans sa langue maternelle.

Sommaire

Un scénario

Une personne, de langue maternelle française, fait une étude sur internet concernant l'éducation par la recherche. À l'heure actuelle, elle tape éducation par la recherche sur un moteur de recherche quelconque. Elle va obtenir en résultat de très nombreux documents, rédigés en français, concernant l'éducation par la recherche, l'éducation à la recherche, la recherche au ministère de l'éducation, la recherche en éducation, le moteur de recherche de l'institut d'éducation à la santé, etc.

Avec UNL, le même scénario change. La personne formule sa recherche de la même manière. Par contre, les résultats sont différents :

  • Les documents trouvés ont été rédigés dans n'importe quelle langue sur internet, mais seront lus par notre utilisateur, en français, sa langue maternelle.
  • Les documents trouvés ne concerneront que l'éducation par la recherche et notre utilisateur pourra se concentrer sur les informations qui l'intéressent vraiment.
  • S'il ne souhaite pas consulter un document dans son intégralité, il pourra consulter un résumé en français, qui sera plus représentatif qu'un simple extrait.
  • Il pourra envoyer un document trouvé à son collègue japonais, qui pourra lui aussi le lire dans sa langue.
  • Il pourra en discuter avec son collègue japonais, tous deux s'exprimant dans leur langue respective.
  • ...

Bien entendu, ce scénario pourra être augmenté à loisir au fur et à mesure que les internautes s'approprieront le système UNL.

Multilinguisme ou Multi-bilinguisme

Le point fort du projet UNL est la promotion du multilinguisme. Une grande confusion règne actuellement sur internet, concernant cet aspect. On entend ainsi dire qu'avec les moteurs de traduction automatique de première ou de seconde génération, internet deviendra multilingue. Cette croyance est fondamentalement fausse !

La première raison provient de la dominance économique de l'anglais. Ainsi, par exemple, en 2007, la société SYSTRAN proposait 12 traducteurs dont 2 seulement où ne figure pas l'anglais (français → allemand et allemand → français). Pour qu'un portugais accède à un document français, il lui faut demander une traduction français → anglais, puis une traduction anglais → portugais. Les erreurs de la seconde traduction se combinant avec celles de la première, le résultat n'a plus grand chose à voir avec le document demandé.

La seconde raison est purement économique. Si l'on souhaite fournir des outils de communication permettant à une communauté de 6 langues de travailler en commun, il faut développer 15 paires de langues (soit 30 traducteurs), 21 pour 7 langues, 28 pour 8 langues, ...

Ainsi, puisqu'il est difficile de développer de nombreuses paires de langues, on développe en priorité des traducteurs de et vers l'anglais.

Aussi, investir dans des techniques se basant sur des outils bilingues a pour effet de renforcer encore la position dominante de l'anglais sur internet. Notre utilisateur portugais, qui souhaitait lire un texte rédigé par un Français, va donc demander la traduction français→anglais dudit texte et il tentera de décoder le résultat anglais.

Une telle politique ne peut donc que creuser le fossé entre les internautes qui comprennent l'anglais et ceux qui ne parlent que leurs langues maternelles. Ainsi, pour beaucoup, le "portail sur le monde" est et restera fermé à clé.

La démarche d'UNL est parfaitement multilingue. En se basant sur une représentation abstraite dont on se sert comme d'un pivot interlingue, toutes les langues sont considérées sur un même pied d'égalité. Ainsi, il suffit de développer un outil qui fait le lien (dans les deux sens) entre une langue et cette représentation pivot adoptée par l'ensemble des partenaires.

Certe, le développement de ces outils est plus complexe que le développement d'une paire de langue pour un traducteur de deuxième génération, mais le bénéfice est évident : pour satisfaire une communauté de 6 langues, il faut développer 6 outils, 7 pour 7 langues, 8 pour 8 langues...

Spécifications du Langage UNL

Le langage UNL est un langage informatique permettant de coder une représentation du sens d'un énoncé. On se sert de cette représentation comme d'un pivot interlingue. Mais attention, le langage UNL n'est pas une langue. Il ne peut être utilisé directement par un non spécialiste.

Depuis le 1er janvier 2000, les spécifications du langage UNL[1] sont ouvertes à tous sur le serveur de l'UNDL (Universal Networking Digital Language Foundation).

Les expressions UNL ne doivent pas seulement être définies rigoureusement, mais être aussi générales que possible pour être comprises par toutes les personnes chargées du développement des enconvertisseurs et des déconvertisseurs.

Le vocabulaire UNL est formé de  :

  • UW (Universal Word ou en français Unité de Vocabulaire Virtuel) qui représentent des acceptions ou ensembles d'acceptions interlingues. Par convention, on a utilisé des mots anglais pour établir le vocabulaire UNL, car cette langue est compréhensible par la majorité des acteurs du projet.
  • étiquettes de relations sémantiques;
  • étiquettes d'attributs qui expriment, à un niveau interlingue, l'actualisation (détermination, nombre, genre), l'aspect, la modalité, l'emphase, etc.

Un attribut particulier, @entry, indique l'élément central de l'énoncé représenté, pour la partie (scope) considérée. Les UW dérivées du mot anglais « book » sont décrites comme suit :

book                      : garde tout sens possible
book(icl>publications)    : sens limité par une UW hyperordonnée
                          = livre en tant que publication
book(=accounts)           : sens limité par une autre UW
                          = livre de comptes
book(obj>room)            : restriction par une relation distinctive
                          = réserver (une chambre)

À titre d'exemple, la phrase Les singent mangent des bananes peut être représentée en UNL comme suit :

Monkeys eat bananas.

Dans l'exemple ci-dessus, "monkey(icl>animal)", eat(icl>action) et banana(icl>food) sont des UWs; "agt" (= agent d'une action) et "obj" (=objet d'une action) sont deux relations sémantiques directes reliant chacune deux UWs et "@present", "@generic" et "@entry" sont des attributs modifiant les UWs.

Développements actuels

Bien évidemment, il reste un long chemin à parcourir avant de voir le projet UNL utilisé par l'ensemble des internautes. Néanmoins, le projet UNL regroupe actuellement 15 langues, développées par des laboratoires universitaires et des entreprises de par le monde. De nombreuses entreprises se sont de plus jointes à l'UNL society.

La stratégie de développement actuelle porte principalement sur la génération d'un énoncé du langage UNL vers une langue naturelle (ce que nous appelons la déconversion). Des expériences plus ponctuelles sont faites chez certains partenaires pour ce qui concerne le chemin inverse (d'un énoncé en langue naturelle vers le langage UNL), que nous appelons enconversion.

La raison de cette stratégie tient dans le fait que la déconversion est plus simple que l'enconversion. De plus, cela nous permet de prouver la validité de notre approche sur un grand nombre de langues (15 actuellement), de familles très différentes.

Objectifs

L'objectif actuel du projet UNL est de monter un ensemble de centres dispersés dans le monde. Chaque centre sera chargé du développement et de la maintenance des outils permettant le traitement d'une langue au sein du système UNL. Chaque centre fournira un service de déconversion et d'enconversion gratuit à l'ensemble des internautes. D'autres outils pourront être développés par d'autres personnes ou entreprises en utilisant le langage UNL, selon les conditions définies par les partenaires et disponibles sur le site de l'UNDL.

Le projet UNL en France

L'équipe GETALP du Laboratoire d'Informatique de Grenoble est chargée du français dans le projet UNL. Un déconvertisseur du français est en cours de développement.

Références

Voir aussi

Bibliographie

Articles connexes

Liens externes

Site Web de l'UNLDL


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Universal Networking Language de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Universal Networking Language — (UNL) is a declarative formal language specifically designed to represent semantic data extracted from natural language texts. It can be used as a pivot language in interlingual machine translation systems or as a knowledge representation… …   Wikipedia

  • Universal Networking Language — Para Universidad Nacional del Litoral, véase Universidad Nacional del Litoral. El lenguaje universal (Universal Networking Language) es una herramienta informática utilizada para permitir que usuarios que utilizan distintos idiomas puedan… …   Wikipedia Español

  • Universal Networking Language — Die Universal Networking Language (UNL) bedeutet Universelle Netzwerksprache. Es handelt sich um eine formale, mathematische Sprache. Sie wird als internationales Kooperationsprojekt vom Institute of Advanced Studies (IAS) der Universität der… …   Deutsch Wikipedia

  • Universal grammar — is a theory of linguistics postulating principles of grammar shared by all languages, thought to be innate to humans (linguistic nativism). It attempts to explain language acquisition in general, not describe specific languages. Universal grammar …   Wikipedia

  • Universal Plug and Play — (UPnP) is a set of computer network protocols promulgated by the UPnP Forum.The goals of UPnP are to allow devices to connect seamlessly and to simplify the implementation of networks in the home (data sharing, communications, and entertainment)… …   Wikipedia

  • Pivot language — A pivot language, sometimes also called a bridge language is an artificial or natural language used as an intermediary language for translation. Using a pivot language avoids the combinatorial explosion of having translators across every… …   Wikipedia

  • Universal Mobile Telecommunications System — (UMTS) is one of the third generation (3G) cell phone technologies, which is also being developed into a 4G technology. Currently, the most common form of UMTS uses W CDMA as the underlying air interface. It is standardized by the 3GPP, and is… …   Wikipedia

  • Universal Primary Education — The second United Nations Millennium Development Goal is to achieve Universal Primary Education, more specifically, to “ensure that by 2015, children everywhere, boys and girls alike will be able to complete a full course of primary schooling.… …   Wikipedia

  • Universal multimedia access — The Universal Multimedia Access (UMA) addresses the delivery of multimedia resources under different and varying network conditions, diverse terminal equipment capabilities, specific user or creator preferences and needs and usage environment… …   Wikipedia

  • Synchronous optical networking — (SONET) and Synchronous Digital Hierarchy (SDH), are two closely related multiplexing protocols for transferring multiple digital bit streams using lasers or light emitting diodes (LEDs) over the same optical fiber. The method was developed to… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”