Grammaire lexicale-fonctionnelle

Grammaire lexicale-fonctionnelle

Le formalisme des grammaires lexicales-fonctionnelles (en anglais Lexical-Functional Grammars, d'où l'acronyme que nous utiliserons désormais, LFG) est un formalisme grammatical utilisé pour formaliser les langues naturelles. C'est un formalisme à décorations dont le formalisme squelette est celui des grammaires non contextuelles, et dont les décorations sont appelées structures fonctionnelles[1]. Historiquement, la définition du modèle par Kaplan et Bresnan au début des années 1980 procède d'une critique des grammaires génératives transformationnelles, en vogue à l'époque, mais dont les trois principaux points faibles étaient leur complexité excessive, leur difficulté à rendre compte des langues à ordre plus libre, et leur inadéquation aux expériences psycholinguistiques censées au contraire plaider en leur faveur.

Sommaire

Idée générale

L'idée sous-jacente à LFG est qu'il n'y a pas nécessairement superposition des fonctions grammaticales avec les positions syntaxiques, pour au moins deux raisons:

  1. les fonctions grammaticales induisent un graphe de dépendances syntaxiques qui n'est pas nécessairement un arbre, alors que les positions syntaxiques induisent une structure d'arbre,
  2. une même position syntaxique peut être remplie par la réalisation de diverses fonctions syntaxiques.

Les fonctions grammaticales sont de ce fait des fondamentaux de la théorie LFG, au même titre que les constituants. Les constituants sont donc gérés par le squelette syntaxique non contextuel[2], et les fonctions grammaticales sont gérées par des équations fonctionnelles qui reposent sur l'unification. Une analyse LFG est donc d'une part un arbre de constituants, appelé structure de constituants ou c-structure, et d'autre part une structure fonctionnelle, ou f-structure, qui est une structure de traits dont nous allons maintenant montrer le contenu et la construction.

Règles de grammaire et construction des structures

Soit une règle du squelette, par exemple S\ \rightarrow\ SN\ V. À chaque non-terminal, de partie droite comme de partie gauche, est associée une f-structure (si S est l'axiome, sa f-structure est la f-structure complète; les autres non-terminaux n'ont qu'une f-structure partielle). Les décorations associées à cette règle squelette définissent par unification la f-structure de S, notée \uparrow, en fonction de celle de SN et de celle de V. Pour cela, on note sous chaque non-terminal les équations où sa f-structure intervient, équations dans lesquelles cette f-structure est notée \downarrow. L'opérateur = note l'unification. Une façon raisonnable de décorer la règle squelette ci-dessus est donc par exemple:


\begin{array}{llll}
S&\rightarrow&SN&V\\
&&(\uparrow {\rm subj}) =\ \downarrow&\uparrow =\ \downarrow\\
\end{array}

Il s'avère pourtant que cette notation, qui positionne des règles sous chaque non-terminal, n'est pas toujours la plus pratique, bien qu'elle soit souvent très lisible. Nous utiliserons donc une autre notation, où toutes les équations sont les unes en dessous des autres, et où on identifie la f-structure du i-ième non-terminal de partie droite par \downarrow i. On notera donc la règle LFG précédente sous la forme suivante:


\begin{array}{lll}
S &\rightarrow& SN\ \ V \\
&&\uparrow {\rm subj =\ \downarrow 1 }\\
&&\uparrow {\rm =\ \downarrow 2 }\\
\end{array}

Certaines règles comportent seulement un mot en partie droite, ce sont les règles lexicales. En voici deux exemples:


\begin{array}{lll}
SN &\rightarrow&{\rm Pierre} \\
&&\uparrow {\rm pred =\ 'Pierre' }\\
&&\uparrow {\rm gender =\ masc }\\
&&\uparrow {\rm number =\ sing }\\
V &\rightarrow& {\rm dort} \\
&&\uparrow {\rm pred =\ 'dormir<subj>' }\\
&&\uparrow {\rm number =\ sing }\\
&&\uparrow {\rm pers =\ 3 }\\
&&\uparrow {\rm mode =\ indicative }\\
&&\uparrow {\rm tense =\ present }\\
\end{array}

Les attributs utilisés dans ces règles sont standards, à l'exception de l'attribut pred, qui a une signification spéciale. La valeur d'un pred commence par un identifiant de l'unité sémantique véhiculée par la tête de la structure. Il est le cas échéant suivi d'un cadre de sous-catégorisation, constitué d'arguments syntaxiques séparés par des virgules. Différentes classes de réalisations possibles d'un même argument sont séparées par le signe | et un argument facultatif est mis entre parenthèses. Les classes de réalisations possibles d'arguments sont prises dans une liste close comprenant typiquement obj (syntagme nominal ou clitique), vcomp (infinitive objet), scomp (complétive objet), acomp (attribut adjectival), ncomp (attribut nominal), toutes les combinaisons possibles de ces classes de réalisations avec une préposition, notées prep-classe (par exemple de-obj ou pour-acomp, voire à-scomp pour à ce que...), ainsi que subj, et adjunct (modifieurs). La classe adjunct est spéciale en ce sens qu'elle va correspondre dans la f-structure à un attribut dont les valeurs possibles ne sont pas des f-structures mais des listes (éventuellement vides) de f-structures. Enfin, les arguments syntaxiques correspondant à des arguments sémantiques sont mis à l'intérieur de chevrons, les autres sont donnés après (voir un exemple plus bas).

Les règles données jusqu'ici permettent d'analyser la phrase Jean dort, le résultat étant le suivant:

Exemple simplifié d'analyse LFG

Cette analyse est correcte car la f-structure obtenue vérifie les trois principes suivants:

  • Unicité: un même attribut ne peut apparaître qu'une seule fois dans une même sous-f-structure, et deux réalisations d'un même argument sous-catégorisé par le pred d'une sous-f-structure donnée ne peuvent pas coexister dans cette sous-f-structure,
  • Cohérence: tout attribut qui est une réalisation d'argument doit être sous-catégorisé par le pred de la sous-f-structure courante,
  • Complétude: tout argument sous-catégorisé par le pred d'une sous-f-structure doit avoir une réalisation qui est présente dans cette sous-f-structure.

Outre l'opérateur = qui dénote l'unification, le formalisme définit d'autres opérateurs permettant de vérifier l'existence ou l'absence d'un trait ou d'ajouter une structure dans une liste de structures (qui remplit un attribut adjunct). Un opérateur particulier permet de rendre obligatoire l'unification d'une structure avec une autre qui apporte une certaine valeur à un certain trait. Cet opérateur, noté = c, est appelé unification contrainte. Pour illustrer cet opérateur, voici une entrée possible de la forme verbale faut (du verbe falloir):


\begin{array}{lll}
V &\rightarrow& {\rm faut} \\
&&\uparrow {\rm pred =\ 'falloir<vcomp>subj' }\\
&&\uparrow {\rm subj\ form =_c il }\\
&&... \\
\end{array}

Cette règle ne pourra participer à la construction d'une structure complète que si la sous-f-structure associée au V est unifiée, à un moment donné de l'analyse, avec une autre structure qui lui confère le trait {\rm subj\ form =\ il}. On note par ailleurs que l'argument subj ne correspondant pas à un argument sémantique, il est placé hors chevrons. C'est ainsi que l'on peut gérer l'impersonnel.

Par ailleurs, il peut s'avérer que deux attributs différents (éventuellement de deux sous-f-structures différentes) ont pour valeur la même structure. Cette valeur est alors partagée.

Enfin, on peut dénoter dans une équation non seulement un (sous-)attribut dans une structure mais également un ensemble de (sous-)attributs, chaque analyse devant choisir un des éléments de cet ensemble. Ceci se fait par l'utilisation d'expressions régulières sur les chemins. Par exemple, une équation comme \uparrow {\rm (vcomp|scomp)^*\ vcomp =\ \downarrow 1} signifie que l'on la f-structure associée au premier symbole de partie droite doit devenir la valeur de l'attribut vcomp de la f-structure associée au symbole de partie gauche ou d'une quelconque de ses sous-f-structures accessible en suivant un chemin ne passant que par des vcomp ou des scomp.

Discussion

Le modèle proposé par LFG est séduisant à bien des égards, tant du point de vue de la modélisation de la langue que du point de vue de la lisibilité des grammaires. On peut lui trouver cependant trois inconvénients principaux. Tout d'abord, c'est un formalisme à décorations dont la complexité importante (il est NP-complet) n'est pas triviale à gérer dans des analyseurs efficaces. Ensuite, les constituants sont nécessairement continus. Enfin, il y a quasiment[3] identité entre dépendances syntaxiques et dépendances sémantiques.

Notes et références de l'article

  1. Kaplan, R. et Bresnan, J.: Lexical-functional grammar: a formal system for grammatical representation. In The Mental Representation of Grammatical Relations, MIT Press, Cambridge, Massachusetts (pages 173–281), 1982.
  2. Il est habituel de considérer que les grammaires non contextuelles ne permettent pas l'optionnalité ou l'opérateur de Kleene sur les non-terminaux de partie droite, alors que le squelette syntaxique de LFG le permet. Ce n'est pourtant qu'une question de notations, puisqu'il y a équivalence forte entre les deux types de grammaires.
  3. Les seuls points qui permettent d'entrevoir une distinction sont d'une part la notion d'arguments hors-chevrons dans les cadres de sous-catégorisation, et d'autre part l'ordre dans lequel les arguments sous-catégorisés sont répertoriés, qui peut éventuellement porter du sens.

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Grammaire lexicale-fonctionnelle de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Grammaire Lexicale-Fonctionnelle — Le formalisme des grammaires lexicales fonctionnelles (en anglais Lexical Functional Grammars, d où l acronyme que nous utiliserons désormais, LFG) est un formalisme grammatical utilisé pour formaliser les langues naturelles. C est un formalisme… …   Wikipédia en Français

  • Grammaire de dépendance — On désigne par grammaire de dépendance une approche à la syntaxe fondée par Lucien Tesnière. Elle se distingue par la place centrale donnée à une structure hiérarchique, appelée Stemma par Lucien Tesnière, mais plus connu aujourd hui sous le… …   Wikipédia en Français

  • Grammaire cognitive — La grammaire cognitive (en anglais : Cognitive Grammar) constitue une approche cognitive du langage, développée depuis 1976 par Ronald Langacker. Celui ci en a présenté les principes dans son ouvrage en deux volumes, Foundations of Cognitive …   Wikipédia en Français

  • Morphologie de la grammaire hébraïque — Morphologie de l hébreu La morphologie de l hébreu[1] (צוּרָנוּת הַעִבְרִית) occupe une place importante dans la grammaire hébraïque : l analyse d un énoncé en phrases[2] (משפטים), et de ces phrases en propositions, est l objet qu étudiera… …   Wikipédia en Français

  • Composition lexicale — Mot composé En linguistique, un mot composé est une juxtaposition de deux lexèmes libres permettant d en former un troisième qui soit un lemme (« mot ») à part entière et dont le sens ne se laisse pas forcément deviner par celui des… …   Wikipédia en Français

  • LFG — Grammaire lexicale fonctionnelle Le formalisme des grammaires lexicales fonctionnelles (en anglais Lexical Functional Grammars, d où l acronyme que nous utiliserons désormais, LFG) est un formalisme grammatical utilisé pour formaliser les langues …   Wikipédia en Français

  • Morphologie de l'hébreu — La morphologie de l hébreu[1] (צוּרָנוּת הַעִבְרִית) occupe une place importante dans la grammaire hébraïque : l analyse d un énoncé en phrases[2] (משפטים), et de ces phrases en propositions, est l objet qu étudiera la syntaxe. L analyse des …   Wikipédia en Français

  • SÉMANTIQUE — «La sémantique, ou comment s’en débarrasser»: jusqu’à une époque récente, l’étude du sens était volontiers considérée comme constituant pour la linguistique une sorte de rejeton indésirable, au nom sans doute de ce réalisme naïf «qui porte à… …   Encyclopédie Universelle

  • Mot-composé — En linguistique, un mot composé est une juxtaposition de deux lexèmes libres permettant d en former un troisième qui soit un lemme (« mot ») à part entière et dont le sens ne se laisse pas forcément deviner par celui des deux… …   Wikipédia en Français

  • Mot Composé — En linguistique, un mot composé est une juxtaposition de deux lexèmes libres permettant d en former un troisième qui soit un lemme (« mot ») à part entière et dont le sens ne se laisse pas forcément deviner par celui des deux… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”