Tagmatica

Tagmatica
TagmaticaArial.jpg

Logo de Tagmatica
Personnages clés Gil Francopoulo
Forme juridique EURL
Siège social Drapeau de France Paris (France)
Activité Text mining
Traitement automatique du langage naturel
Entités nommées
Software
Fouille de textes
Standardisation
Produits TagParser (français, anglais, espagnol)
Site web www.tagmatica.com [1]

Tagmatica est une société française spécialisée dans l'informatique documentaire et linguistique. Elle a été fondée en 2002 par Gil Francopoulo qui est l'auteur de la norme ISO des dictionnaires électroniques LMF.

Sommaire

Activités

Les activités sont la standardisation, les dictionnaires, les analyseurs morphologiques et syntaxiques des langues, la détection de langue et le calcul automatique de thématiques.

Contexte

La majeure partie de la connaissance étant formulée sous forme de textes, il s'agit de les traiter automatiquement pour en obtenir les structures syntaxiques, les entités nommées, les citations et/ou des indicateurs numériques qui synthétisent le corpus. Alors que la plupart des acteurs se limitent à l'application de règles de "pattern matching" sur de petits fragments de phrases, les outils de Tagmatica réalisent des analyses syntaxiques complètes afin de détecter à la fois les attachements de courte mais aussi ceux de longue distance. Ces derniers sont difficiles à traiter et posent de sérieux problèmes aux outils datant d'une dizaine d'années. Le défi était de mettre au point des outils rapides pour analyser des dizaines de millions de mots dans un temps raisonnable. Les langues traitées actuellement sont le français, l'anglais avec un début d'implémentation de l'espagnol.

Principales publications

  • Language Resources and Evaluation / Springer Verlag 2008 (DOI: 10.1007/s10579-008-9077-5): Multilingual resources for NLP in the lexical markup framework (LMF)
  • Gesellschaft für linguistische Datenverarbeitung GLDV-2007/Tubingen: Lexical Markup Framework ISO standard for semantic information in NLP lexicons [2]
  • Language Resources and Evaluation LREC-2006/Genoa: Lexical Markup Framework (LMF) [3]
  • Language Resources and Evaluation LREC-2006/Genoa: The relevance of standards for research infrastructures [4]

Sites web


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Tagmatica de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

  • Scribo — (Semi automatic and Collaborative Retrieval of Information Based on Ontologies) est un projet de recherche appliquée en informatique linguistique et en ingénierie des connaissances. Sommaire 1 Objectif 2 Financement 3 Participants au projet …   Wikipédia en Français

  • Nuxeo — Création 2000 Fondateurs Stefane Fermigier Personnages clés Stefane Fermigier Forme juridique …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”