- Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole
-
GETALP Création 2007 Siège Bâtiment IMAG B - 385 avenue de la Bibliothèque
38400 Saint-Martin-d'HèresPays France Coordonnées Rattachement Laboratoire LIG CNRS UMR 5217 Directeur Hervé Blanchon Disciplines Informatique, Linguistique Chercheurs statutaires 14 Chercheurs associés 2 Doctorants 12 Site web http://www.getalp.org modifier Géolocalisation sur la carte : France
Le Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole ou GETALP, anciennement GETA est une équipe de recherche en traduction automatique et traitement automatisé des langues et de la parole, issue du premier laboratoire français de traduction automatique, le Centre d'Études sur la Traduction Automatique (CETA), créé le 24 décembre 1959.
Sommaire
Historique
1959 : le CETA
En 1959, l'intérêt du CNRS pour les recherches en traduction automatique se confirme avec une demande en traduction automatique du russe, en documentation automatique, en analyse numérique et en automatisme.
À cette fin, il faut équiper en calculateurs électroniques deux ou trois super-centres, Paris, Grenoble et Toulouse, auxquels est confiée l'étude des problèmes prioritaires.
Le CETA est finalement créé le 24 décembre 1959 par une convention entre le CNRS, la DEFA (Direction des études et fabrications d'armement) et le CASDEN (Comité d'action scientifique de défense du centre d'exploitation scientifique et technique du ministère de la Défense). Il est créé au sein du Laboratoire de calcul numérique de l'Institut Blaise-Pascal du CNRS. Il a pour mission « l'étude et la conception d'une méthode pour la traduction automatique notamment du russe en français et l'étude de l'organisation générale d'une machine pour cette fin ».
Le directeur du laboratoire de calcul numérique, René de Possel, et son sous-directeur, André Lentin, par ailleurs membre fondateur de l'ATALA (Association pour le traitement automatique des langues), joueront un rôle important dans l'interaction entre mathématiques appliquées, langages formels et linguistique. Ils sont tous deux membres du conseil scientifique du CETA[1].
LE CETA est ensuite réparti en deux sections : le CETAP à Paris et le GETAG à Grenoble.
Le CETAP
L'armée est, à plusieurs titres, partie prenante dans l'affaire. Le CETAP bénéficie des locaux du Laboratoire central de l'armement (LCA) au Fort de Montrouge à Arcueil. Son directeur, Aimé Sestier, né en 1920, est ingénieur militaire en chef, chef de la section des machines à calculer du LCA.
Les ingénieurs et le personnel technico-administratif appartiennent au LCA. Les linguistes, sept slavistes et deux germanistes, sont rémunérés par le CNRS.
L'abandon du travail en linguistique fondamentale va progressivement conduire Aimé Sestier à démissionner et à dissoudre le CETAP en octobre 1962[2].
1960 : le CETAG
Grenoble est à cette époque l'un des principaux lieux d'implantation de l'informatique en France. C'est à Grenoble qu'est fondée l'AFCAL (Association française de calcul) en 1957, et Jean Kuntzmann y crée la revue Chiffres en 1958.
La seconde section du CETA est alors créée à Grenoble. Et c'est au laboratoire de calcul de la faculté des sciences, avec le soutien du professeur Jean Kuntzmann qu'est créé le CETAG sous la direction de Bernard Vauquois.
Le CETAG comprend en 1960, quatre spécialistes de russe, une technicienne germaniste, et une technicienne spécialiste de japonais. En ce qui concerne les informaticiens, le directeur de la programmation a sous ses ordres deux programmeurs. Le groupe compte également deux ingénieurs mathématiciens préparant un doctorat de mathématiques appliquées.
Après la dissolution du CETAP, ne reste donc plus que le groupe de Grenoble, qui, tout en continuant à être rattaché à l'Institut Blaise-Pascal, devient laboratoire propre du CNRS en 1963, en gardant le nom de CETA.
1971 : le GETA
Malgré la crise induite par le rapport ALPAC (en), le CETA tient bon. Ses crédits sont augmentés et ses locaux agrandis. Toutefois, il faut pondérer cette impression de prospérité : le CETA se porte très bien en 1967, mais moins bien en 1971, date à laquelle il sera privé d'une partie de ses forces, chercheurs et moyens, et perd son statut privilégié de laboratoire propre du CNRS. Malgré cela, cette stabilité a permis au CETA, devenu GETA en 1971, de prendre un second souffle et de réaliser dès le début des années 1970 Ariane-78, un système multiniveaux fondé sur la méthode de transfert, considéré comme un des plus importants et des plus influents de l'époque. Il s'agissait alors de traduction automatique (TA) sans préédition ni postédition , que nous appelons aujourd'hui TA du veilleur. Cette période se caractérise par l'application éclairée de la théorie des langages formels et de leur compilation au problème de la TA, ainsi que par l'intégration de théories linguistiques de pointe, avec en particulier le passage par un "langage pivot"[3].
Le GETA a été dirigé par Bernard Vauquois jusqu'à son décès en 1985. Le GETA est membre de la fédération IMAG, depuis la création de cette dernière en 1986.
De 1971 à 1980, le GETA, se tournant vers la TA du réviseur, élabora et expérimenta une nouvelle méthodologie de la TAO (Traduction Assistée par Ordinateur) par approche transfert multiniveau et un générateur de systèmes de TAO (Ariane-78).
De 1981 à 1987-88, le GETA participa activement à des transferts de technologie vers l'industrie, tout en réalisant en interne un système "préopérationnel" russe-français pour la DRET, plusieurs études pour le projet Eurotra[4], et en aidant divers groupes étrangers à construire des maquettes ou des prototypes de systèmes de TA. Le système Ariane-78 fut profondément remanié et étendu, et donna naissance à Ariane-G5.
La disparition de Bernard Vauquois, au milieu du Projet National TAO, pour lequel sa participation était très importante, fut un grand choc. De 1986 à 1990, l'équipe s'efforça de mener à bien les diverses actions en cours, tout en se restructurant et en diminuant son activité de développement et d'expérimentation en vraie grandeur au profit d'une recherche plus fondamentale. À partir de 1988-90, considérant que le transfert technologique sur la TAO du réviseur avait été effectué, le GETA réorienta sa recherche vers la TAO individuelle, qui comporte deux volets, la TAO du traducteur et la TAO du rédacteur.
François Peccoud, à l'époque Professeur à l'Université Pierre Mendès-France, prit ensuite la direction du GETA de 1985 à 1995 avant de devenir président de l'Université de technologie de Compiègne[5].
1997 : rattachement au CLIPS
En 1997 est fondé le laboratoire CLIPS (Communication Langagière et Interaction Personne Système). Celui-ci regroupe 6 équipes dont le GETA et GEOD (Groupe d'Études sur l'Oral et le Dialogue). LE GETA perd son statut de laboratoire autonome pour devenir une équipe de ce nouveau laboratoire. Ce sera l'occasion pour le GETA de déménager dans les locaux du CLIPS. La distance n'est pas très grande (500 m) mais le changement suffit malheureusement à perdre l'organisation de la bibliothèque. Depuis cette époque, les personnels CNRS du GETA partant à la retraite ne seront plus remplacés. Le CLIPS est toujours membre de la fédération IMAG. L'équipe GETA est alors dirigée par Christian Boitet[6], Professeur à l'Université Joseph Fourier.
En 1997 également, le GETA commence à travailler sur le projet Universal Networking Language (UNL), fondé par l'Université des Nations unies, dans le but de mettre au point un langage formel informatique, servant de pivot interlingue sémantique et permettant de favoriser l'éclosion d'un véritable multilinguisme[7].
2007 : le GETALP, création du LIG
Le premier janvier 2007, les laboratoires qui composaient la fédération IMAG, dont le CLIPS, ont été dissous et les équipes de recherche se sont réparties dans de nouveaux laboratoires dont le Laboratoire d'Informatique de Grenoble (LIG). À cette occasion, les équipes GETA et GEOD ont fusionné pour donner naissance à l'actuelle équipe GETALP, dirigée par Hervé Blanchon, Maître de conférences habilité de l'Université Pierre Mendès-France (Grenoble 2) [8]. Le GETALP intègre alors le LIG dès sa fondation.
2011 : lancement de Aximag
L'équipe développe le concept de passerelle de traduction (iMAG, interactive Multilingual Access Gateway) qui permet de naviguer sur un site traduit dans sa langue alors que le site original ne l'est pas. Ainsi avec une passerelle de traduction, les textes seront traduits, mais les clics sur les différents liens "internes" du site, permettront de visiter les pages demandées tout en restant dans la passerelle, les liens externes restants inchangés.
En 2011, Aximag[9], une jeune pousse "en émergence" est créée entre le GETALP et la société de valorisation Floralis[10], filiale de l'Université Joseph Fourier. Aximag proposera des services par abonnement et des prestations spécifiques autour du concept d'iMAG. Il est possible de voir un exemple d'iMAG sur le site du laboratoire LIG.
Aujourd'hui le GETALP compte 14 enseignants-chercheurs issus des 5 établissements universitaires du PRES grenoblois (dont 12 informaticiens et 2 linguistes), 3 ingénieurs de recherche (dont 2 informaticiens et 1 linguiste), 1 collaborateur bénévole, 12 doctorants, 2 post-docs et 7 visiteurs et stagiaires.
Activités de recherche
Le but des travaux du GETALP est de contribuer de façon significative à l’émergence d’une informatique ubilingue, dans le contexte du développement de l’informatique ubiquitaire. Cet objectif nécessite de mener à bien des recherches à caractère souvent pluridisciplinaire, en informatique, en linguistique et psycholinguistique, en sémantique (lien avec les ontologies), en pragmatique (pour le dialogue), et en traitement de l’oral[11].
L'équipe GETALP est actuellement organisée autour de six thèmes de recherche principaux : 1 : Traduction Automatique (TA) et Automatisée (TAO); 2 : Traitement Automatique des Langues (TALN) et plates-formes associées; 3 : Collecte et construction de ressources linguistiques; 4 : Multilinguisme dans les systèmes d’information; 5 : Reconnaissance automatique de la parole, des locuteurs, des sons et des dialectes; 6 : Analyse sonore et interaction dans les environnements perceptifs.
Les activités de ces thèmes de recherche partagent cinq défis :
- rendre l’informatique multilingue et "ubilingue"
- informatiser les langues peu dotées[12] et peu écrites en adaptant des ressources existantes
- rendre la communication langagière multimodale (texte, parole, geste)
- trouver et implémenter des méthodes et outils d’évaluation liés à la tâche
- utiliser l'interaction contributive pour collecter des ressources, améliorer des traductions et communiquer avec "sens garanti".
Voir aussi
Articles connexes
- Bernard Vauquois, fondateur du GETA
- Laboratoire d'Informatique de Grenoble (LIG),
- Institut d'informatique et mathématiques appliquées de Grenoble (IMAG), d'où est issu le LIG
- Traduction automatique (TA)
- Traduction assistée par ordinateur (TAO)
- Traitement automatique du langage naturel (TALN)
- Universal Networking Language
Liens externes
- Site officiel du LIG
- Site de l'équipe GETALP
- (en) Contributions de B. Vauquois à la construction de systèmes de TA Bernard VAUQUOIS' contribution to the theory and practice of building MT systems: a historical perspective
- La constitution du TAL Étude historique des dénominations et des concepts
- 50 ans d'histoire de l'ATALA
Notes et références
- http://histoire-cnrs.revues.org/3461 Le CNRS et les débuts de la traduction automatique en France
- http://www.atala.org/ATALA-cinquante-ans 50 ans d'histoire de l'ATALA
- http://www.getalp.org/xwiki/bin/view/Main/HistoryGETA Histoire du GETA
- ISBN 978-2859395025), 156 p. Anne-Marie Loffler-Laurian, La traduction automatique, Éditions Septentrion, Paris, 1998 (
- https://ged.aeres-evaluation.fr/guest.php?sole=Y&app=AERES_DIFFCV&action=AERES_DIFFCV_DOWNLOAD_CV&id=83748 CV de François Peccoud
- http://www.etudes-francaises.net/entretiens/boitet.htm Études françaises, Marie Lebert, Entretien avec Chrisitian Boitet
- Description du projet UNL, consulté sur www.getalp.org le 20 août 2011
- http://www-clips.imag.fr/geta/herve.blanchon/ Page personnelle de Hervé Blanchon
- http://www.aximag.fr/ Site Web de Aximag
- http://www.floralis.fr Site Web de la société Floralis
- http://www.getalp.org/ Présentation du GETALP
- http://tel.archives-ouvertes.fr/docs/00/04/68/93/PDF/tel-00006313.pdf Thèse de Vincent Berment
- Portail de l’informatique
- Portail Grenoble Métropole
Catégories :- Laboratoire de recherche français
- Laboratoire d'informatique
- Recherche à Grenoble
- Université Grenoble I
Wikimedia Foundation. 2010.