Item lexical

Item lexical

Lemme (linguistique)

Page d'aide sur l'homonymie Pour les articles homonymes, voir lemme.

Le lemme (ou lexie, ou item lexical) est l'unité autonome constituante du lexique d'une langue. C'est une suite de caractères formant une unité sémantique et pouvant constituer une entrée de dictionnaire. Dans le vocabulaire courant, on parlera plus souvent de mot, notion qui, cependant, manque de clarté. On construit des énoncés avec des lemmes, les lemmes sont faits de morphèmes.

Chaque lemme possède un signifiant et un signifié uniques en ce sens que l'ensemble de sa (ou ses) dénotations - sens propre - et de ses connotations - sens figurés - ajouté à ses possibilités d'emploi ne sont pas représentés par un autre lemme. Par exemple, les lemmes synonymes travailler et trimer ne sont pas identiques, outre la différence de signifiant. Bien qu'ils renvoient tous deux au même dénoté, celui de « fournir un effort en vue d'un résultat », l'un appartient au registre courant, l'autre au registre familier. Le premier possède une connotation neutre voire positive, le second est franchement péjoratif et décrit l'effort sous l'angle de la pénibilité. On dira que le champ sémantique de chaque lemme est unique : le lexique ne souffre pas la redondance.

Sommaire

Constitution des lemmes

Dans les langues indo-européennes (comme le français ou l'anglais), les lemmes sont constitués de phonèmes assemblés en morphèmes. Un lemme comme anticonstitutionnellement, par exemple, s'analyse ainsi :

préfixes lexème suffixes
anti- con- -stitu- -tion -nelle -ment

Dans d'autres types de langues comme les langues isolantes, le lemme se réduit à un lexème ou un assemblage de lemmes (mot composé), sans morphèmes, le plus souvent assez court. Ainsi, en mandarin le lemme pour « cœur » est xīn, celui pour « ami » 朋友 péngyou (lemme composé). Dans ce type de langues, la syntaxe est souvent plus rigide que dans les langues dont les lemmes sont formés de morphèmes : en effet, rien (ou presque) ne permet de distinguer les classes lexicales. Ainsi, le verbe pour « manger » se dit 吃飯 chīfàn quand il est employé sans complément d'objet (littéralement : « je mange de la nourriture ») mais chī quand le complément d'objet est exprimé :

  • 我吃飯 wǒ chīfàn « je mange (de la nourriture) »
  • 我吃肉 wǒ chī ròu « je mange (de la) viande ».

Forme des lemmes

Dans les langues indo-européennes

Un lemme peut être :

  • simple : un seul mottendre, amour, jamais ;
  • composé : un mot composé (mot formé de plusieurs mots) → rouge gorge, (s')entre(-)tuer ;
  • complexe :
    • un syntagme (groupe de mots placés dans un sens précis et s'organisant autour d'un terme central) →: vert-de-gris, petit-bourgeois, grand-chose,
    • une expression complète → je-ne-sais-quoi, je-m'en-foutiste.

Dans d'autres langues

En mandarin, par exemple, la notion de lemme apparaît différemment (on en a vu un exemple plus haut). On trouvera les explications voulues dans l'article Sinogramme.

Autonomie des lemmes

Chaque lemme possède une classe lexicale et un signifié indépendants de ses composants quand il n'est pas un mot simple (on parlera de lemme complexe). D'autre part, son autonomie se retrouve dans le fait qu'il n'a pas besoin d'être associé à un morphème ou à un autre lemme pour exister. Par exemple, garou, dans loup-garou n'est pas un lemme. En effet, garou ne peut se dire seul. De même, -ons, dans marchons n'est pas un lexème.

Il est souvent difficile de déterminer l'inventaire exact des formes relevant d'un lemme. Un exemple bien connu est celui des participes du français:

  • Dans Il est mort, on verra tantôt le passé composé du lemme mourir (construit à l'aide de l'"auxiliaire être": Il est mort en quelques instants), tantôt le lemme être suivi du lemme mort (Il est vraiment mort).
  • Les dernières éditions du Bescherelle (resp. M. Arrivé, éd. Hatier) se distinguent des précédentes en signalant l'existence en français d'un gérondif constitué de en + participe présent ; suivant cette approche, en mourant ("gérondif présent"), en étant mort ("gérondif passé") sont des formes du lemme mourir.

Mais il serait également loisible d'exclure les phénomènes d'auxiliation ou de collocation grammaticale du champ de l'analyse en lemmes. Suivant la décision prise, une opération automatique de réduction d'un texte aux lemmes qui le constituent (par exemple pour construire un index ou concordance) fera ou ne fera pas apparaître les occurrences de être ou de en dans les exemples donnés.

Sens du lemme composé ou complexe

Quand le lemme dépasse le mot simple, il est doté d'un signifiant indépendant de ses constituants : par exemple, le lemme chou-fleur doit être compris indépendamment de chou et fleur. Ce n'est pas un chou en fleur ni une fleur de chou mais un légume bien précis. De même, rouge gorge ne se dit pas de tout ce qui a la gorge rouge : seule une espèce de passereau particulière est concernée.

Classe lexicale du lemme composé ou complexe

Grippe-sou a beau être composé d'abord d'un verbe gripper puis de son régime, le nom sou, c'est un nom. De même, je-m'en-foutiste est une expression complète constituée de pronoms (je, me, en) et d'une forme adjectivale dérivée du verbe (s'en) foutre, c'est un simple adjectif.

On voit bien qu'un lemme perd le mode de fonctionnement de ses constituants : qu'en-dira-t-on est une expression lexicalisée (devenue un lemme) fonctionnant comme un nom mais pas comme un syntagme : on ne peut pas dire « le qu'en-disais-tu ».

Lemmes et dictionnaires

Un dictionnaire recense les lemmes d'une langue mais non les formes de ce lemme. Quand cette langue est flexionnelle ou agglutinante, l'entrée du dictionnaire se fait au moyen d'une forme dite canonique :

  • pour les noms : au singulier pour les langues sans déclinaison (français : pommespomme), au nominatif singulier pour le latin (solitudinibussolitudo) ou le grec ancien (φλεϐῶν / phlebỗn → φλέψ / phléps), au nominatif ou sous la forme du thème morphologique en sanskrit (aśvasyaaśva-, forme sans désinence), à la forme absolue en turc (kaynağınkaynak), etc ;
  • pour les verbes : à l'infinitif en français (mourrontmourir) ou turc (okuyordumokumak), à la première personne du singulier du présent de l'indicatif en latin (amabimusamo) et en grec (ἐλελύκεσαν / elelúkesan → λύω / lúô), etc.

Les règles de classement des lemmes dans le dictionnaire d'une langue doivent donc s'apprendre et nécessitent une connaissance de la grammaire de la langue, d'autant plus quand cette langue est flexionnelle et, pire, quand le début du mot peut être modifié par la flexion (le classement alphabétique se faisant depuis le début du mot vers la fin). Les méthodes d'apprentissage des langues étrangères concernées ainsi que les grammaires expliquent souvent à un étudiant de cette langue comment chercher les mots dans le dictionnaire quand la recherche peut être complexe. De même, les dictionnaires recensent parfois les formes difficiles de certains lemmes en renvoyant vers le lemme canonique.

Voici quelques exemples :

  • l'étudiant latiniste rencontrant la forme poposcerunt doit, en absolu, chercher à posco, qui en est la forme canonique. Un dictionnaire de la langue latine comme le Gaffiot (Dictionnaire latin français abrégé de Félix Gaffiot, Livre de poche, par exemple) recense cependant poposci en indiquant qu'il s'agit du parfait de posco. L'étudiant connaissant la grammaire de cette langue saura que poposcerunt est la troisième personne du parfait indicatif actif du verbe posco, « réclamer ». Une personne qui, sans aucune connaissance du latin, chercherait cette forme ne pourrait savoir que poposci et poposcerunt sont deux formes d'un même temps d'un même verbe et ne pourrait relier poposcerunt à posco ; pire, si le dictionnaire ne marque pas le renvoi de poposci à posco, on ne peut établir aucun lien puisque les deux formes ne sont pas classées à la même page, l'initiale du mot étant modifiée au parfait ;
  • toujours en latin, la forme milites ne sera dans aucun dictionnaire, sous forme papier, reliée à sa forme canonique, miles, « soldat ». En effet, savoir qu'un mot terminé par -ites de ce type peut être dérivé d'un nom fini par -es et débutant par les mêmes lettres fait partie des compétences fondamentales du latiniste. Un profane n'aura aucune chance de déchiffrer même grossièrement un texte latin car chercher le sens des mots, indépendamment de la syntaxe, n'est pas toujours possible ;
  • par contre, toujours en latin, certains dictionnaires informatiques (comme www.dicolatin.com dictionnaire latin Contart) peuvent retrouver le lemme; la forme milites sera reliée à sa forme canonique, miles, « soldat »; Rechercher "latus" affichera la forme canonique "fero" et ses sens, mais aussi "latus,a,um" et ses sens. C'est aussi le principe du Wiktionnaire (pour toutes les langues). De tels dictionnaires permettent alors de retrouver des lemmes homographiques.
  • le cas est très fréquent en grec : cette langue utilisant un augment et le redoublement (consulter Conjugaisons du grec ancien), l'initiale des verbes est souvent très altérée. Même si les dictionnaires de grec usuels fournissent des pistes de recherches, il faut déjà connaître la grammaire de la langue pour savoir que la forme ᾤμωξα ốimôksa dépend du lemme οἰμώζω oimốzô, « se lamenter ». Même si le squelette des deux formes est identiques, les seules lettres en commun forment la syllabe -μω- au centre du mot ;
  • dans les langues celtes, le phénomène des mutations consonantiques initiales est notable : en gallois, par exemple, il faut chercher garreg, charreg ou ngharreg à carreg, « pierre ». Toutes ces formes résultent en effet des mutations consonantiques qu'entraînent des mots-outils comme les déterminants.

Lexicalisation

Quand un mot simple, mot composé, etc., entre dans le lexique d'une langue, on parle de lexicalisation : on dira que je-ne-sais-quoi est lexicalisé, par opposition à je ne comprends rien. Je-ne-sais-quoi, en effet, est doté d'une classe lexicale unique (ici le nom, qu'on peut faire précéder d'un article) et renvoie à un signifié précis. On ne peut en changer le signifiant.

Terminologie

Les notions de lemme et de lexème sont employées de manière très variable selon les linguistes et leur école de pensée. Pour certains, ce qu'on nomme ici lemme est un lexème et le mot lemme n'est pas employé. Dans cette encyclopédie, même si ce choix est contestable, on utilisera lexème et lemme de cette manière :

  • le lemme est l'unité autonome du lexique ;
  • le lexème est le constituant lexical, autonome ou non, d'un lemme.

Articles connexes

Ce document provient de « Lemme (linguistique) ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Item lexical de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Item Lexical — Lemme (linguistique) Pour les articles homonymes, voir lemme. Le lemme (ou lexie, ou item lexical) est l unité autonome constituante du lexique d une langue. C est une suite de caractères formant une unité sémantique et pouvant constituer une… …   Wikipédia en Français

  • Lexical Markup Framework — (LMF) is a work in progress within International Organization for Standardization ISO/TC37 in order to define a common standardized framework for the construction of natural language processing (NLP) and machine readable dictionary (MRD) lexicons …   Wikipedia

  • Lexical item — Lexical items are single words or words that are grouped in a language s lexicon. Examples are cat , traffic light , take care of , by the way , and don t count your chickens before they hatch . Lexical items are those which can be generally… …   Wikipedia

  • Lexical markup framework — (LMF ou cadre de balisage lexical, en français) est le standard de l Organisation internationale de normalisation (plus spécifiquement au sein de l ISO/TC37) pour les lexiques du traitement automatique des langues (TAL). L objectif est la… …   Wikipédia en Français

  • item — 1. item [ itɛm ] adv. • 1279; adv. lat. ♦ Comm. De même, en outre (dans un compte, un état). item 2. item [ itɛm ] n. m. • v. 1960; mot angl. « article, élément », du lat. item ♦ Anglic. Didact. Élément minimal d un ensemble organisé. ⇒ unité.… …   Encyclopédie Universelle

  • Lexical category — In grammar, a lexical category (also word class, lexical class, or in traditional grammar part of speech) is a linguistic category of words (or more precisely lexical items ), which is generally defined by the syntactic or morphological behaviour …   Wikipedia

  • Lexical Markup Framework — El Lexical Markup Framework (LMF) es un proyecto en fase de desarrollo de la Organización Internacional para la Estandarización ISO/TC37 con el fin de definir un marco común normalizado para la construcción de lexicones y diccionarios máquina… …   Wikipedia Español

  • lexical category — noun A linguistic category of words (or more precisely lexical items), generally defined by the syntactic or morphological behaviour of the lexical item in question, such as noun or verb. Syn: word class, lexical class, part of speech …   Wiktionary

  • lexical item — noun A term word or a sequence of words that acts as a unit of meaning, including words, phrases, phrasal verbs and proverbs, exemplified by cat , traffic light , take care of , by the way , and dont count your chickens before they hatch . Syn:… …   Wiktionary

  • lexical unit — noun A lexical item …   Wiktionary

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”