Extraction terminologique

Extraction terminologique

L'extraction terminologique est une application du traitement automatique du langage naturel qui consiste à extraire automatiquement une liste de termes à partir d'un corpus spécialisé. Les logiciels réalisant l'extraction terminologique sont appelés extracteurs de termes.

Sommaire

Applications

Les termes extraits par l'extracteur de termes peuvent être utilisés de plusieurs façons :

  • Terminologie assistée par ordinateur : Dans ce cas, l'extracteur de termes aide le terminologue dans sa tâche en lui "prémâchant" le travail. On parle alors de candidats-termes et non de termes. Le/la terminologue dépouille la liste de candidats-termes (phase dite de dépouillement terminologique) proposés par l'extracteur et sélectionne les termes qu'il ou elle souhaite ajouter à la terminologie en cours de construction.
  • Création de ressources bilingues : Une fois extraits, les termes peuvent être alignés avec leurs traductions. Ceci permet de créer des dictionnaires spécialisés/glossaires/terminologies bilingues utiles pour la traduction humaine et la traduction automatique
  • Création d'index thématiques : Les termes peuvent être utilisés comme entrées d'un index thématique que ce soit pour un livre, un manuel ou pour un site web (ex.: nuages de mots clés). Dans ce cas, ils aident le lecteur/l'internaute à s'orienter dans le document, en lui donnant un accès direct aux thématiques traitées.

Indices pour l'identification automatique des termes

Les indices utilisés pour l'identification automatique de termes sont de trois sortes :

  • Spécificité du terme : Le terme est bien plus courant dans le corpus spécialisé qu'il ne l'est dans un corpus de langue générale.
  • Forme : Le termes sont bien souvent des syntagmes nominaux mais peuvent aussi être des syntagmes verbaux ou adjectivaux. Dans tous les cas, on s'attachera à reconnaître un syntagme bien formé, le plus souvent en s'appuyant sur des patrons morpho-syntaxiques.
  • Cohésion : Si le terme est composé de plusieurs mots, ceux-ci montrent un fort degré de cohésion, c'est-à-dire qu'ils apparaissent fréquemment ensemble (on dit qu'ils cooccurrent fréquemment).

Généralement, l'extracteur de termes prend en entrée un corpus pré-traité : les textes du corpus ont été découpés en phrases, les phrases sont découpées en mots et les mots ont été étiquetés.

Voir aussi

Liens externes

Sites traitant de l'extraction terminologique

Quelques extracteurs

Extracteurs plutôt destinés à l'indexation

Extracteurs plutôt destinés à la terminologie assistée par ordinateur


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Extraction terminologique de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • Tropes (logiciel) — Tropes Développeur Communauté Tropes Dernière version Tropes V8.1 …   Wikipédia en Français

  • Décret du 3 juillet 1996 relatif à l'enrichissement de la langue française — Le décret du 3 juillet 1996 relatif à l enrichissement de la langue française est un décret français pris le 3 juillet 1996 pour l application de la loi Toubon de 1994 qui fait suite à la loi constitutionnelle du 25 juin 1992. Il est… …   Wikipédia en Français

  • Pierre sèche — Sommaire 1 Clarification terminologique 2 Utilisations 3 Origine du matériau 3.1 Dérochement …   Wikipédia en Français

  • SUCRE — Selon qu’ils sont employés au pluriel ou au singulier, comme adjectif ou comme substantif, les termes «sucre» et «sucré» prennent une signification différente et de plus en plus délimitée. Au pluriel, les sucres sont les glucides (du terme grec… …   Encyclopédie Universelle

  • Grippe — Virions grippaux (Myxovirus influenzae) quittant leur cellule hôte, grossis cent mille fois. Cliché de microscopie électronique en transmission issu de la bibliothèque d images de Santé publique du Center for Disease Control[1] …   Wikipédia en Français

  • Influenza — Grippe Pour les articles homonymes, voir GRIP. Virions grippaux (Myxovirus influenzae) quittant leur cellule hôte, grossis cent mill …   Wikipédia en Français

  • Pollicipes cornucopia — Pouce pied Pour les articles homonymes, voir Pouce et Pied …   Wikipédia en Français

  • Pollicipes pollicipes — Pouce pied Pour les articles homonymes, voir Pouce et Pied …   Wikipédia en Français

  • Pouce-pied — Pour les articles homonymes, voir Pouce et Pied. Pouce pied …   Wikipédia en Français

  • Pouce pied — Pour les articles homonymes, voir Pouce et Pied …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”