- Tagmatica
-
Logo de TagmaticaPersonnages clés Gil Francopoulo Forme juridique EURL Siège social Paris (France) Activité Text mining
Traitement automatique du langage naturel
Entités nommées
Software
Fouille de textes
StandardisationProduits TagParser (français, anglais, espagnol) Site web www.tagmatica.com [1] modifier Tagmatica est une société française spécialisée dans l'informatique documentaire et linguistique. Elle a été fondée en 2002 par Gil Francopoulo qui est l'auteur de la norme ISO des dictionnaires électroniques LMF.
Sommaire
Activités
Les activités sont la standardisation, les dictionnaires, les analyseurs morphologiques et syntaxiques des langues, la détection de langue et le calcul automatique de thématiques.
Contexte
La majeure partie de la connaissance étant formulée sous forme de textes, il s'agit de les traiter automatiquement pour en obtenir les structures syntaxiques, les entités nommées, les citations et/ou des indicateurs numériques qui synthétisent le corpus. Alors que la plupart des acteurs se limitent à l'application de règles de "pattern matching" sur de petits fragments de phrases, les outils de Tagmatica réalisent des analyses syntaxiques complètes afin de détecter à la fois les attachements de courte mais aussi ceux de longue distance. Ces derniers sont difficiles à traiter et posent de sérieux problèmes aux outils datant d'une dizaine d'années. Le défi était de mettre au point des outils rapides pour analyser des dizaines de millions de mots dans un temps raisonnable. Les langues traitées actuellement sont le français, l'anglais avec un début d'implémentation de l'espagnol.
Principales publications
- Language Resources and Evaluation / Springer Verlag 2008 (DOI: 10.1007/s10579-008-9077-5): Multilingual resources for NLP in the lexical markup framework (LMF)
- Gesellschaft für linguistische Datenverarbeitung GLDV-2007/Tubingen: Lexical Markup Framework ISO standard for semantic information in NLP lexicons [2]
- Language Resources and Evaluation LREC-2006/Genoa: Lexical Markup Framework (LMF) [3]
- Language Resources and Evaluation LREC-2006/Genoa: The relevance of standards for research infrastructures [4]
Sites web
Wikimedia Foundation. 2010.