- Laboratoire informatique d'Avignon
-
LIA Siège Avignon Rattachement Université d'Avignon et des Pays de Vaucluse CNRS UPRES 4128 Disciplines Informatique modifier Le Laboratoire informatique d'Avignon ou LIA est un laboratoire de recherche français en informatique sous la tutelle de l'Université d'Avignon et des Pays de Vaucluse (UAPV), situé dans les terrains du Technopole Agroparc d'Avignon. Le LIA est une Unité propre de recherche de l'enseignement supérieur (UPRES 4128) créée en 1987, qui regroupe les enseignants-chercheurs relevant de la 27e section du Conseil national des universités (CNU) ainsi que les étudiants de doctorat et du master durant la période consacrée à leur travail de recherche. Ce laboratoire est actif dans les thématiques de recherche sur l'optimisation, les réseaux et le traitement automatique du langage. Il a organisé de nombreuses conférences nationales et internationales (JEP/TALN 2008, IEEE WIMOB 2008), s'engage dans des campagnes d'évaluation (NIST, ESTER, Défi fouille de Texte, DUC/TAC, ...). Une grande partie des outils qui sont développés au LIA sont distribués sous licence libre (MISTRAL/ALIZE, SPEERAL, CORTEX).
Sommaire
Fonctionnement
Le LIA se situe dans les terrains du Technopole Agroparc[1]. Il est composé en 2011 de 26 chercheurs et enseignants-chercheurs fonctionnaires titulaires, de 5 chercheurs invités, d'environ 15 contractuels techniques (ingénieurs, post-doctorants, chercheurs) et administratifs, ainsi que d'une trentaine de doctorants. Malgré sa petite taille, il s'agit d'un laboratoire dynamique "à la pointe dans le traitement du langage écrit et oral, la reconnaissance vocale"[2], domaines de sa spécialisation[3]. Son budget en 2007-08 est d'environ 800K euros, dont une grande partie provient du financement des projets de recherche.
Les étudiants en thèse du LIA sont tous financés. Ils le sont soit sur fonds issus des projets de recherche (ANR ou européens), par des allocations de recherche ministérielles ou régionales, des conventions CIFRE ou encore des bourses de gouvernements étrangers.
Domaines de recherche
Les activités de recherche du Laboratoire informatique d'Avignon couvrent plusieurs domaines de l'informatique. La liste inclut le traitement du langage naturel et de la parole, les réseaux informatiques, le multimédia, la représentation des connaissances, les interactions homme-machines, l'optimisation et la recherche d'information. Plusieurs projets sont financés par des organismes comme l'Agence nationale de la recherche (ANR), l'Association nationale de la recherche technique (ANRT) et des projets européens, comme le projet de dialogue homme-machine LUNA auquel participe également l'Université de Trente (Italie), l'Université de Rhénanie-Westphalie (Allemagne) et l'Académie des sciences de Pologne[4]. Le LIA privilégie le développement des outils de type source libre, ce qui permet la diffusion de logiciels[5] et du savoir faire du laboratoire. Des technologies de pointe, telles que le résumé multimédia (audio, video, image et texte) et guidé par l'analyse d'une opinion[6] font l'objet des études récentes du LIA[7].
Capacité de calcul et équipements
Le laboratoire possède ses propres capacités de calcul avec un cluster d'environ 200 cœurs, au premier Avril 2011, fonctionnant sous le système d'exploitation Mosix, environ 500 gigaoctets de mémoire vive pour 50 téraoctets de mémoire de masse. Ce cluster est exclusivement utilisé par les chercheurs du LIA (doctorants ou titulaires). Ce cluster est utilisé pour les applications de traitement automatique du langage, l'analyse de données multimédia, les travaux du laboratoire en recherche opérationnelle et sur les réseaux informatiques. Les stations de travail fonctionnent majoritairement sous Linux (Ubuntu), Windows et Mac OS/X.
Rayonnement
International
Le LIA et l'IRIT ont organisé en 2004 le congrès Recherche d'information assistée par ordinateur (RIAO), conférence internationale en recherche d'information qui se déroule tous les trois ans sous l'égide du Centre de hautes études internationales d’informatique documentaire (CID) depuis 1985. Ce congrès de haut niveau est organisé par des institutions comme le Massachusetts Institute of Technology (MIT) en 1998, l'Université McGill en 1997 ou le Collège de France en 2000. Son édition de 2007 a eu lieu à l'Université Carnegie Mellon (Pittsburgh) et a été parrainée par le Commissariat à l'énergie atomique, Google et Microsoft. En 2008, le LIA a organisé la conférence internationale IEEE WiMob'08[8].
Le laboratoire participe également aux conférences internationales dans ses domaines de recherche orginisées par les société savantes internationales (IEEE, ACL, ACM, ISCA, ...). En 2012 la conférence The European Chapter of the ACL ([EACL]) sera organisé par le LIA.
Enfin, les outils développés au LIA sont évalués régulièrement dans le cas des campagnes internationales, comme celles du National Institute of Standards and Technology (agence du Département du Commerce des États-Unis visant à développer l'innovation et la compétitivité industrielle)[9]. Le laboratoire est notamment le porteur du projet Alizé, plateforme d'authentification biométrique qui est utilisé par de nombreux industriels et laboratoires académiques (Thalès (FR), MIT(USA), CMU (USA), Berkeley (ICSI, USA), QUT(Australie), IIT/Kampur (Inde), ENST(FR), Univesity of Swansea (UK), ...).
National
Le LIA et l'UAPV ont organisé en 2008 les conférences JEP (Journées d'Études sur la Parole) et TALN-RECITAL (Traitement automatique des langues naturelles) qui portent sur la recherche en parole, phonétique, linguistique computationnelle et Traitement automatiques de langues naturelles et en parole, réunissant 300 spécialistes venus de 14 pays[10]. Il a également organisé le congrès de la Société française de recherche opérationnelle et d'aide à la décision (ROADEF) du 26 au 28 février 2003[11]. Le LIA a organisé, en novembre 2009, les conférences pour jeunes chercheurs MajecSTIC[12] et RJCP[13].
Le LIA est l'un des acteurs participant à Technolangue. Ce projet, créé à la suite d'un rapport du Conseil supérieur de la langue française remis à Lionel Jospin en novembre 2000, a pour objet la création et le suivi d'actions concernant le traitement informatique de la langue[14]. Le LIA fait également partie du projet ANR AVI-SON, dont le but est de concevoir une plate forme d'indexation automatique de documents audio-visuels concernant la formation des chirurgiens et élèves chirurgiens[15].
Travaux de recherches par thématique
Le laboratoire se consacre à des recherche dans les domaines du traitement automatique de la langue naturelle, écrite et orale, à la recherche opérationnelle et aux réseaux informatiques.
Traitement du langage
Le groupe Langage du LIA est composé de 13 enseignants/chercheurs permanents et d'une vingtaine de chercheurs ou d'ingénieurs contractuels. La couverture thématique sur le domaine est assez large, les recherches réalisées portant sur une grande variété d'objets linguistiques (parole lue ou spontanée, dialogues, texte mono ou multilingues...) des niveaux et des paradigmes de représentation (signal, syntaxe, concepts, thèmes, etc...), des objectifs applicatifs (extraction d'information linguistique ou extra-linguistique, analyse des contenus parlés ou écrits, recherche d'information, résumé automatique, systèmes de dialogue, etc...). Cette diversité des sujets d'études est abordée avec une culture scientifique et technologique principalement basée sur les statistiques bayésiennes, l'apprentissage et la classification automatique, la théorie de l'information. Enfin, les méthodologies mises en oeuvre reposent le plus souvent sur des expérimentations sur corpus, le développement de systèmes et leur engagement dans des campagnes d'évaluation.
Traitement automatique de la parole (RAP)
Différents aspects du traitement automatique de la parole sont étudiés au LIA : reconnaissance de la parole, du locuteur, des langues, indexation audio, caractérisation de pathologies de la voix... Ces recherches s'appuient sur un environnement logiciel développé au LIA et librement distribuable sous licence GPL ou LGPL, notamment :
- SPEERAL : Moteur de reconnaissance automatique de la parole continue grand vocabulaire, basé sur un algorithme A*. Ce système est sous licence LGPL.
- MISTRAL : Plateforme open source d'authentification biométrique (ANR)
Le laboratoire participe à des campagnes d'évaluation internationales sur ces domaines et participe - ou porte - de nombreux projets collaboratifs nationaux et européens (ANR en cours : Sumacc, OT-media, Decoda, PI, ASH, DesphoApady, RPM2, Avison, PERCOL, ...).
Parole en interaction, analyse des contenus extraits, traduction automatique
Les activités de recherche de l'équipe sur ces thèmes concernent principalement les modèles de langage et de compréhension, en particulier dans les applications de dialogue. Un autre aspect des recherches réalisées porte sur la fouille des données audio (extraction d’entités nommées, d’opinions…) et sur la traduction automatique, thème pour lequel le LIA s'est engagé dans la campagne d'évaluation WMT 2011. Il a participé à des projets collaboratifs sur ce thème (projets européens LUNA et DIVINES, ANR Port-Media, DECODA...
Traitement automatique de la langue naturelle écrite (TALNE)
Particulièrement actif dans ce domaine, le LIA a participé à des campagnes d'évaluations nationales et internationales sur les algorithmes de fouille de textes, d'apprentissage automatique et de classification automatique, parmi lesquelles on peut citer :
- Document Understanding Conferences (DUC), devenu Text Analysis Conference (TAC) , soutenu par le National Institute of Standards and Technology[16].
- Text REtrieval Conference, soutenu par le National Institute of Standards and Technology.
- Défi Francophone de Fouille de Textes (DEFT), lancé en 2005, où il s'est classé 1er en 2005, 2007 et 2008.
- ESTER, campagne d'évaluation pour les systèmes de transcription de la parole et d'étiquetage par entités nommées
Des recherches en Résumé automatique, Compression automatique de phrases, Recherche d'information, Moteur de recherche, Systèmes de Question-Réponse, Génération automatique de textes et Terminologie au moyen de la théorie des graphes sont développées au LIA. Le résumé automatique de texte multidocument, projet de recherche RPM2 est financé par l'ANR avec la participation de Sinequa (moteur de recherche avec des approches linguistiques et statistiques), Eurecom, Syllabs et Wikio.
Optimisation
Le LIA étudie l'optimisation combinatoire, notamment les problèmes de sac-à-dos quadratique ou multidimensionnel et l'Ordonnancement. D'autres domaines de la recherche opérationnelle tels que la théorie des graphes, la théorie des jeux, la théorie des files d'attente et chaînes de Markov sont abordés en tant qu'outils de recherche.
Réseaux
Les activités du LIA en réseaux sont centrées autour de l'algorithmique distribuée pour la conception de protocoles de communication, de modélisation et d'évaluation des performances. Les protocoles pour le multicast, le multimédia, la sécurité informatique et la garantie de la QoS « Qualité de service » sont étudiés dans un environnement de réseaux hétérogènes. La théorie des jeux est utilisée comme outil de modélisation. Le laboratoire collabore avec l'INRIA de Sophia-Antipolis à travers des projets comme Networking Games And Biologically Inspired Networks financés par ARC Popeye. Ce groupe de recherche s'intéresse au comportement de systèmes complexes où un ensemble d'agents interagissent, suivant l'intérêt grandissant que porte la recherche à l'approche multi-disciplinaires (mathématiques appliqués, économie, biologie...) appliquée à la modélisation de populations[17],[18].
Références
- (fr) Le technopole Agroparc
- (fr) Site officiel de la ville d'Avignon : développement économique
- (fr) La Tribune des industries de la langue et de l'information électronique, n° 25-26 AUPELF (Agence universitaire de la Francophonie)
- (fr) Projet LUNA
- (fr) La recherche française se met à l'Open source
- (fr) Wikio fait de la Recherche
- (fr) Le Monde Informatique du 29 janvier 2008: Sinequa expose RPM2, projet de résumés intelligents et multimédias des contenus en ligne
- (en) Conférence internationale WiMob'08 sponsorisée par l'IEEE
- (en) Speaker Recognition Evaluation
- (fr) "Les langues et l'informatique font bon ménage" p. 8, La Provence du 13 juin 2008
- (fr) Congrès de 2003 de la Société française de recherche opérationnelle et d'aide à la décision
- (fr) MajecSTIC 2009
- (fr) RJCP 2009
- (fr) Historique de Technolangue
- (fr) Le projet AVI-SON
- (en) Text Analysis Conference
- Pour un tour d'horizon, se référer aux Complex networks et à la modélisation des populations avec des modèles multi-compartiments.
- (en) ARC Popeye
Liens externes
- (fr) Site officiel
- (fr) Thématiques de recherche
- (fr) Projets de recherche en cours
Catégories :- Laboratoire de recherche français
- Laboratoire d'informatique
- Université d'Avignon
Wikimedia Foundation. 2010.