- Laboratoire Informatique d'Avignon
-
Laboratoire Informatique d'Avignon
LIA Localisation Avignon Domaines Informatique Rattachement Université d'Avignon et des Pays de Vaucluse Code UPRES 4129 Le Laboratoire Informatique d'Avignon ou LIA est un laboratoire de recherche français en informatique sous la tutelle de l'Université d'Avignon et des Pays de Vaucluse (UAPV), situé dans les terrains du Technopole Agroparc d'Avignon. Le LIA est une Unité Propre de Recherche de l'Enseignement Supérieur (UPRES 4129) crée en 1987, qui regroupe les enseignants-chercheurs relevant de la 27e section du Conseil national des universités (CNU) ainsi que les étudiants de doctorat et du master durant la période consacrée à leur travail de recherche. Ce laboratoire est actif dans les thématiques de recherche sur l'optimisation, les réseaux et plus particulièrement le langage. Il a organisé de nombreuses conférences internationales dans ce dernier domaine, participant à plusieurs campagnes nationales et internationales, dont le Défi fouille de Texte.
Sommaire
Fonctionnement
Le LIA se situe dans les terrains du Technopole Agroparc[1]. Il est composé en 2008 de 25 chercheurs et enseignants-chercheurs, d'environ 15 personnes dans les services de soutien technique et administratif, ainsi que d'une quarantaine de doctorants. Malgré sa petite taille, il s'agit d'un laboratoire dynamique "à la pointe dans le traitement du langage écrit et oral, la reconnaissance vocale"[2], domaines de sa spécialisation[3]. Son budget en 2007-08 est d'environ 800K euros, dont une grande partie provient du financement des projets de recherche. Les étudiants en thèse du LIA sont financés par les projets, des allocations de recherche ministérielles ou régionales, bourses CIFRE ou bourses des gouvernements étrangers.
Domaines de recherche
Les activités de recherche du Laboratoire Informatique d'Avignon couvrent plusieurs domaines de l'informatique. La liste inclut le traitement du langage naturel et de la parole, les réseaux informatiques, le multimédia, la représentation des connaissances, les interactions homme-machines, l'optimisation et la recherche d'information. Plusieurs projets sont financés par des organismes comme l'Agence nationale de la recherche (ANR), l'Association Nationale de la Recherche Technique (ANRT) et des projets européens, comme le projet de dialogue homme-machine LUNA auquel participe également l'Université de Trente (Italie), l'Université de Rhénanie-Westphalie (Allemagne) et l'Académie des Sciences de Pologne[4]. Le LIA privilégie le développement des outils de type source libre, ce qui permet la diffusion de logiciels[5] et du savoir faire du laboratoire. Des technologies de pointe, telles que le résumé multimédia (audio, video, image et texte) et guidé par l'analyse d'une opinion[6] font l'objet des études récentes du LIA[7].
Capacité de calcul et équipements
Le laboratoire possède ses propres capacités de calcul avec un cluster de 200 coeurs, au premier février 2009, fonctionnant sous le système d'exploitation Mosix, et environ 1 téra-octet de mémoire vive. Ce cluster est exclusivement utilisé par les chercheurs du LIA (doctorants ou titulaires). La capacité de stockage est supérieure à 4 téras octets. Ce cluster est utilisé pour les applications de TALN et de Recherche Opérationnelle (solveur C Plex). Les stations de travail fonctionnent majoritairement sous Linux (Ubuntu), Windows et Mac OS/X.
Rayonnement
International
Le LIA et l'IRIT ont organisé en 2004 le congrès Recherche d'Information Assistée par Ordinateur (RIAO), conférence internationale en recherche d'information qui se déroule tous les trois ans sous l'égide du Centre de Hautes Études Internationales d’Informatique Documentaire (CID) depuis 1985. Ce congrès de haut niveau est organisé par des institutions comme comme le Massachusetts Institute of Technology (MIT) en 1998, l'Université McGill en 1997 ou le Collège de France en 2000. Son édition de 2007 a eu lieu à l'Université Carnegie Mellon (Pittsburgh) et a été parrainée par le Commissariat à l'énergie atomique, Google et Microsoft. En 2008, le LIA organise la conférence internationale IEEE WiMob'08[8].
Le laboratoire participe également aux conférences internationales Language Resources and Evaluation Conference (LREC)[9] avec le soutien du consortium European Language Resources Association (en) (ELDA/ELRA). En 2008, le comité de cette conférence comprenait Charles J. Fillmore (professeur émérite de linguistique à Berkeley), Sadaoki Furui (auteur de nombreux ouvrages sur le traitement du langage et ayant reçu des récompenses de l'IEEE) ou encore Joseph Olive de la DARPA (agence du Département de la Défense des États-Unis).
Enfin, les outils développés au LIA sont évalués régulièrement dans le cas des campagnes internationales, comme celles du National Institute of Standards and Technology (agence du Département du Commerce des États-Unis visant à développer l'innovation et la compétitivité industrielle)[10].
National
Le LIA et l'UAPV ont organisé en 2008 les conférences JEP (Journées d'Études sur la Parole) et TALN-RECITAL (Traitement Automatique des Langues Naturelles) qui portent sur la recherche en parole, phonétique, linguistique computationnelle et Traitement automatiques de langues naturelles et en Parole, réunissant 300 spécialistes venus de 14 pays [11]. Il a également organisé le congrès de la Société française de recherche opérationnelle et d'aide à la décision (ROADEF) du 26 au 28 février 2003[12].
Le LIA est l'un des acteurs participant à Technolangue. Ce projet, créé à la suite d'un rapport du Conseil supérieur de la langue française remis à Lionel Jospin en novembre 2000, a pour objet la création et le suivi d'actions concernant le traitement informatique de la langue[13]. Le LIA fait également partie du projet ANR AVI-SON, dont le but est de concevoir une plate forme d'indexation automatique de documents audio-visuels concernant la formation des chirurgiens et élèves chirurgiens[14].
Travaux de recherches par thématique
Dialogue
En dialogue homme machine, le LIA conçoit des modèles de langage qui minimisent les erreurs sur les hypothèses générées venant de systèmes de reconnaissance automatique de la parole (RAP). Y sont également étudiés le dialogue et l'expansion des requêtes en recherche documentaire.
Reconnaissance Automatique de la Parole (RAP)
Plusieurs outils informatiques sont développés dans le cadre de la recherche sur la reconnaissance automatique de la parole :
- SPEERAL : Moteur de reconnaissance automatique de la parole continue grand vocabulaire, basé sur un algorithme A*.
- MISTRAL : Plateforme open source d'authentification biométrique (ANR)
Traitement Automatique de la Lange Naturelle Écrite (TALN)
Particulièrement actif dans ce domaine, le LIA a participé à des campagnes d'évaluations nationales et internationales sur les algorithmes de fouille de textes, d'apprentissage automatique et de classification automatique, parmi lesquelles on peut citer :
- Document Understanding Conferences (DUC), devenu Text Analysis Conference (TAC) , soutenu par le National Institute of Standards and Technology[15].
- Text REtrieval Conference, soutenu par le National Institute of Standards and Technology.
- Défi Francophone de Fouille de Textes (DEFT), lancé en 2005, où il s'est classé 1er en 2005, 2007 et 2008.
- ESTER, campagne d'évaluation pour les systèmes de transcription de la parole et d'étiquetage par entités nommées
Des recherches en Résumé automatique, Recherche d'information, Moteur de recherche, Systèmes de Question-Réponse, Génération automatique de textes et Terminologie au moyen de la théorie des graphes sont développées au LIA. Le résumé automatique de texte multidocument, projet de recherche RPM2 est financé par l'ANR avec la participation de Sinequa (moteur de recherche avec des approches linguistiques et statistiques), Eurecom, Syllabs et Wikio.
Optimisation
Le LIA étudie l'optimisation discrète et la théorie des jeux. D'autres domaines de la recherche opérationnelle tels que la théorie des graphes, la théorie des files d'attente et chaînes de Markov sont abordés en tant qu'outils de recherche.
Réseaux
Les activités du LIA en réseaux sont centrées autour de l'algorithmique distribuée pour la conception de protocoles de communication, de modélisation et d'évaluation des performances. Les protocoles pour le multicast, le multimédia, la sécurité informatique et la garantie de la QoS « Qualité de service » sont étudiés dans un environnement de réseaux hétérogènes. La théorie des jeux est utilisée comme outil de modélisation. Le laboratoire collabore avec l'INRIA de Sophia-Antipolis à travers des projets comme Networking Games And Biologically Inspired Networks financés par ARC Popeye. Ce groupe de recherche s'intéresse au comportement de systèmes complexes où un ensemble d'agents interagissent, suivant l'intérêt grandissant que porte la recherche à l'approche multi-disciplinaires (mathématiques appliqués, économie, biologie...) appliquée à la modélisation de populations. [16],[17].
Références
- ↑ (fr) Le technopole Agroparc
- ↑ (fr) Site officiel de la ville d'Avignon : développement économique
- ↑ (fr) La Tribune des industries de la langue et de l'information électronique, N° 25-26 AUPELF (Agence universitaire de la Francophonie)
- ↑ (fr) Projet LUNA
- ↑ (fr) La recherche française se met à l'Open source
- ↑ (fr) Wikio fait de la Recherche
- ↑ (fr) Le Monde Informatique du 29 janvier 2008: Sinequa expose RPM2, projet de résumés intelligents et multimédias des contenus en ligne
- ↑ (en) Conférence internationale WiMob'08 sponsorisée par l'IEEE
- ↑ (en) LREC
- ↑ (en) Speaker Recognition Evaluation
- ↑ (fr) "Les langues et l'informatique font bon ménage" p.8, La Provence du 13 juin 2008
- ↑ (fr) Congrès de 2003 de la Société Française de Recherche Opérationnelle et d'Aide à la Décision
- ↑ (fr) Historique de Technolangue
- ↑ (fr) Le projet AVI-SON
- ↑ (en) Text Analysis Conference
- ↑ Pour un tour d'horizon, se référer aux Complex networks et à la modélisation des populations avec des modèles multi-compartiments.
- ↑ (en) ARC Popeye
Liens externes
- (fr) Site officiel
- (fr) Projets de recherche en cours
- Portail de l’informatique
- Portail de Vaucluse
Catégories : Laboratoire de recherche français | Laboratoire d'informatique | Université d'Avignon
Wikimedia Foundation. 2010.