Reconnaissance des mots

Reconnaissance des mots

La lecture est une aptitude cognitive consistant à identifier des mots issus du langage écrit et à en extraire leur signification. Mais qu’est-ce qu’un mot ? Dans les langues telles que l’anglais ou le français, le mot est l’unité linguistique de base, une combinaison de lettres entourées de deux espaces. Ces combinaisons reposent sur des règles précises (un « q » ne peut par exemple être directement suivi par un « a ») et jouent un rôle crucial dans l’identification des mots. L’étude de la reconnaissance visuelle des mots, et plus généralement de la lecture, cherche donc à comprendre les mécanismes par lesquels l’homme est capable d’identifier une unité purement graphique (le mot) et de lui associer un sens. Certes la lecture semble automatique et vous n’êtes, à l’instant même, pas conscient des processus vous permettant d’identifier une chaîne de caractères, de lui associer une prononciation et enfin de lui donner un sens.

Sommaire

Le mot : élément fondateur de la lecture

Tout lecteur est capable de décoder près de 200 mots par minute et ce de façon quasi-automatique. Une expérience menée par Stroop[1]en 1935 illustre cet accès automatique au sens du mot (ou information sémantique) au-delà de ses caractéristiques graphiques. Les volontaires devaient en effet nommer la couleur avec laquelle un mot était écrit sans prêter attention à la couleur désignée par ce dernier. Si le mot « rouge » est écrit en bleu, le sujet devait répondre bleu et non rouge. Les résultats sont frappants : le temps d’identification de la couleur avec laquelle est écrite le mot est plus long lorsque le mot désigne une couleur différente (par exemple « rouge » écrit en bleu). Ce phénomène d’interférence sémantique, ou Effet Stroop, illustre le caractère automatique de la reconnaissance et de la compréhension d’un mot. Le lecteur ne peut s’empêcher d’associer une information graphique (la chaîne de caractères) à une information sémantique (le sens du mot).

Il existe ainsi des processus permettant de d’identifier des éléments visuels et morphologiques, de les faire correspondre avec des connaissances mises en mémoire par notre cerveau pour enfin accéder au sens du mot.

Eléments visuels et reconnaissance des mots

Certains auteurs ont proposé l’idée d’une reconnaissance du mot via sa forme globale (reconnaissance holistique)[2]. Cette dernière définit le mot comme une suite de lettres écrites en minuscules, les caractères pouvant être montants (b, d, f …), neutres (a, c, e …) ou descendants (p, g, q …). La forme globale dépend donc de la typographie, la police et la taille des lettres utilisées. Elle disparaît pour des mots écrits en majuscules. Ainsi, vous mettrez plus longtemps à reconnaître un texte écrit en majuscules (MAJUSCULE) ou de façon alternée (MaJuScUleS)[3]. De même, certaines études ont montré qu’il était plus difficile d’identifier une erreur lorsque la forme globale est conservée (love et loce) que lorsqu’elle est altérée (love et lope).

Cependant, de nouveaux résultats suggèrent que la forme globale des mots ne jouerait aucun rôle dans leur reconnaissance visuelle. A l’heure actuelle, on considère que l’information d’un mot est contenue dans l’identité abstraite des lettres qui le constituent. Le terme ici de "identité abstraite" fait référence au fait qu'une lettre telle que "a" peut être identifiée comme telle quelle que soit la casse (A ou a), la police (a en Times New Roman, en Arial, mais aussi toutes les subtiles variations émergeant de l'écriture manuscrite) ou encore la taille. Pour lire un mot, les lettres contenues doivent être identifiées. La question de l'ordre des lettres est également fondamentale. L'ordre des lettres permet au lecteur de distinguer les anagrammes tels que niche, chien et chine par exemple. Cependant, on sait aujourd'hui que le système de reconnaissance contient également une certaine flexibilité concernant le codage de l'ordre des lettres puisque des lettres non adjacentes bénéficient aussi d'un codage particulier. Ainsi, dans le mot NICHE, le système de reconnaissance code les lettres individuelles N I C H E, mais aussi les bigrammes adjacents NI IC CH HE ainsi que ceux non adjacents -I NC IH CE H-.

Eléments dits prélexicaux et reconnaissance des mots

Le terme de "prélexical" fait référence aux informations contenues dans le mot de longueur inférieur au mot. Ainsi, on peut distinguer la syllabe, le morphème, mais aussi le graphème, la rime et encore la lettre. Les modèles de reconnaissance de mots postulent également que ces éléments prélexicaux interviennent dans la reconnaissance avant l'accès au lexique. Le terme "pré-" a ainsi une connotation également temporelle.

La syllabe jouerait un rôle important dans la reconnaissance visuelle des mots. En 1973, Spoehr et Smith[4] ont montré que les pourcentages d’erreur d’identification des mots de 5 lettres et deux syllabes étaient plus élevés que pour les mots de 5 lettres à une syllabe. De même, les lettres ne semblent pas lues séparément mais seraient regroupées en unités syllabiques. Cet effet a également été trouvé chez les pseudomots, ou chaîne de caractères ressemblant à des mots mais n’ayant aucun sens. L’effet syllabique est donc bien un effet dit prélexical, puisqu’il intervient indépendamment de la nature lexicale ou non de la suite de lettres présentées.

Des effets infrasyllabiques, renvoyant à des entités plus petites que la syllabe telle que la lettre, la rime ou le graphème, joueraient également un rôle dans la reconnaissance visuelle des mots. Ainsi, le nombre de lettres faciliterait la lecture des mots contenant 3 à 5 lettres, ralentirait celle des mots de plus de 8 lettres et n’aurait pas d’effet pour les mots de 5 à 8 lettres. Les graphèmes (ou représentation écrite d’un son) serait la pierre angulaire de la lecture silencieuse puisqu’ils correspondent à l’association d’une unité visuelle à une unité de prononciation, acquise lors de l’apprentissage de la lecture. Voici des exemples de graphème de la langue française "ou", "ch", "oin" et de la langue anglaise "oa", "sh", "th". Ceux-ci bénéficieraient d'un codage particulier lors de la reconnaissance de mots: le système perceptif serait à même donc de coder les lettres abstraites "O" et "U" mais aussi l'entité perceptive graphémique "OU".

Eléments lexicaux et reconnaissance des mots

La fréquence d’un mot estime le nombre moyen de fois qu’un lecteur a rencontré le mot au cours de ses lectures. Par exemple, les mots « table » ou « faire » sont rencontrés beaucoup plus fréquemment que les mots « hypocrisie » ou « ornithorynque ». L’effet de fréquence est l’un des plus connu en psychologie cognitive de la lecture : les mots de forte fréquence seraient identifiés plus vite que les mots de faible occurrence. Les récentes études de neuroimagerie telles que la magnétoencéphalographie ou l’électro-encéphalographie ont démontré que l’effet de fréquence interviendrait dès 200ms après la présentation du mot[5],[6].

La fréquence d’occurrence repose sur une mesure objective du nombre de fois qu’un sujet a rencontré un mot et est basé sur l’étude statistique d’un grand nombre de textes. La familiarité, elle, repose sur l’expérience des lecteurs. Ces deux valeurs sont fréquemment corrélées. Le verbe « faire », par exemple, est à la fois un mot de haute fréquence et de haute familiarité. A l’inverse, le terme « présomption » présente une faible fréquence d’occurrence mais sera familier des avocats. Connine et al[7],[8] ont ainsi montré que les mots familiers sont reconnus plus vite que les mots peu familiers, et ce indépendamment de l’effet de fréquence.

Un autre effet majeur en psychologie cognitive de la lecture est celui du voisinage orthographique. Deux voisins orthographiques sont deux mots différant d’une seule lettre. Par exemple, le mot « louche » admet de nombreux voisins orthographiques – « bouche, mouche, couche, douche » - alors que le mot « ogre » n’a pour voisin que le mot « ocre ». On distingue alors deux composantes : la taille du voisinage (ou nombre de voisins) et la fréquence du voisinage (voisins plus ou moins fréquents que le mot source). Les mots possédant un grand nombre de voisins sont ainsi reconnus plus lentement que les mots possédant un nombre faible de voisins[9]. De même, les temps d’identification d’un mot sont plus longs lorsque le mot cible comporte un voisin orthographique de plus haute fréquence. Cependant, ces effets restent durs à étudier puisque le nombre de voisins est fortement corrélé à la taille du mot de départ (les longs mots admettent moins de voisins orthographiques).

Effets de répétition et reconnaissance des mots

Il a été montré que la reconnaissance des mots fréquemment répétés était plus rapide lorsque des derniers ont déjà été présentés au lecteur. Cet effet de répétition présente deux composantes: une composante à long terme et une composante à court terme.

L'effet de répétition à long terme peut faciliter la lecture d'un mot sur une période allant de quelques secondes à plusieurs jours et joue un rôle plus important pour les mots de basse fréquence que les mots de haute fréquence. L'une des hypothèses proposées suggère que le sujet garde en mémoire le souvenir de l'information graphique qui lui a été présenté. Cela faciliterait l'étape de reconnaissance perceptive du mot. Le sujet doit également être conscient du caractère répétitif de la tâche, ce qui expliquerait un effet de répétition important pour les mots de basse fréquence (sans conscience de cet effet, la répétition se confond avec la fréquence).

La composante à court terme joue un rôle sur une durée de l'ordre de la seconde et est indépendant de la fréquence du mot présenté. En d'autre terme, l'effet de répétition à court terme facilite aussi bien la lecture des mots de basse fréquence que des mots de haute fréquence. L'une des expériences consiste à présenter rapidement un mot (dit amorce), le masquer puis présenter le même à lire (mot cible). Par exemple "Arbre" puis "Arbre". De même que pour l'effet à long terme, se pose la question des origines de la reconnaissance facilitée du mot cible. Est-elle permise par une identification perceptive plus rapide? Des effets prélexicaux ou encore des effets sémantiques?

Modèle d'Activation Interactive de la reconnaissance de mots

Nous présentons ici un des modèles les plus influents en Europe sur la reconnaissance de mots chez le lecteur expert: le modèle d'Activation Interactive (ou IA, Interactive Activation) de McClelland & Rumelhart (1981) [10] . Nous décrirons par la suite divers successeurs de ce modèle. Le modèle IA initial tel que publié en 1981 décrit l'activation orthographique lors de l'accès au lexique. Il postule différents niveaux de traitement:

  • le niveau "traits" constitué des caractéristiques physiques visuelles des stimuli (lignes horizontales, verticales, diagonales, courbes comme par exemple les / - \ du A).
  • le niveau "lettres" constitué des 26 lettres de l'alphabet.
  • le niveau "mot" constitué de tous les mots du lexique.

Ces niveaux de traitement sont interconnectés par des connexions de type excitatrice et inhibitrice. Ainsi, les connexions excitatrices se situent principalement entre les différents niveaux tandis que les connexions inhibitrices se situent entre les niveaux ainsi qu'en intra niveau. Lors de la présentation d'un input visuel tel un mot, les traits correspondant à l'input s'activent et viennent alors activer les lettres correspondantes. Les lettres ne contenant pas ces traits sont elles inhibées. Puis ces lettres viennent activer les mots les contenant (en respectant la position de la lettre dans le mot) et inhiber ceux ne la contenant pas. Le modèle est dit interactif puisque les connexions sont bidirectionnelles. Il existe ainsi des boucles rétroactives, notamment du niveau mot vers le niveau lettres. Ainsi, les mots activés viennent renforcer les lettres les contenant et inhiber celles ne les contenant pas. A l'intérieur de chaque niveau trait, lettre et mot, opèrent des connexions de type inhibitrice. Le phénomène d'inhibition intra niveau au niveau lexical est ainsi appelé inhibition latérale ou compétition lexicale.

Plus récemment, d'autres modèles issus du modèle IA ont été proposés afin d'en étendre ses apports.

  • Le modèle d'activation interactive bimodal (BIAM, Bimodal Interactive Activation Model) de Diependale, Ziegler & Grainger (2010) [11] inclut des niveaux d'activation phonologique (lexicale et sublexicale) ainsi qu'un niveau de conversion graphèmes - phonèmes.

Voir aussi

Notes et références

  1. Stroop (1935). Effects of interference in serial verbal reactions. Journal of Experimental Psychology, http://psychclassics.yorku.ca/Stroop/
  2. Healy, Cunningham (1992). A developmental evaluation of the role of word shape in word recognition. Memory & Cognition http://cat.inist.fr/?aModele=afficheN&cpsidt=5154947
  3. Mayall, Humphreys.(2006). The Effects of Case Mixing on Word Recognition: Evidence from a PET Study. Journal of Cognitive Neuroscience http://portal.acm.org/citation.cfm?id=1163363
  4. Spoehr, Smith (1973). The role of syllables in perceptual processing. Cognitive psyghology http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6WCR-4D5XCKP-71&_user=1495569&_coverDate=07%2F31%2F1973&_rdoc=1&_fmt=high&_orig=search&_sort=d&_docanchor=&view=c&_searchStrId=1265152347&_rerunOrigin=google&_acct=C000053194&_version=1&_urlVersion=0&_userid=1495569&md5=b20d8b760155183b5ca78bf4a972c1a8
  5. Dambacher Kiegl (2006). Frequency and predictability effects on event related potentials during reading. Brain Researchhttp://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6SYR-4JHMFMK-4&_user=1495569&_coverDate=04%2F21%2F2006&_rdoc=1&_fmt=high&_orig=search&_sort=d&_docanchor=&view=c&_searchStrId=1265157330&_rerunOrigin=google&_acct=C000053194&_version=1&_urlVersion=0&_userid=1495569&md5=a15a31bf628c876654b0fe55e7293d85
  6. Monsell, Doyle, Haggard (1989). Effect of frequency on visual word recognition tasks: where are they? Journal of Experimental psychology. Generalhttp://www.ling.cogsci.uci.edu/~jsprouse/courses/fa09/249/readings/monsell1989.pdf
  7. Connine, Mullenix, Shernoff (1990). Word familiarity and frequency in visual and auditory word recognition. Journal of experimental psychology.
  8. Gernsbacher (1984). Resolving 20 years of inconsistent interactions between lexical familiarity and orthography, concreteness, and polysemy. Journal of experimental psychology. General
  9. Grainger, Segui (1992). Neighborhood frequency effects in visual word recognition. Perception & Psychophysics.
  10. McClelland, J. L. & Rumelhart, D. E. (1981). An interactive activation model of context effects in letter perception: Part 1. An account of Basic Findings. Psychological Review, 88, 375-407.
  11. Diependaele, K., Ziegler, J., & Grainger, J. (2010). Fast phonology and the bi-modal interactive activation model. European Journal of Cognitive Psychology, 22(5), 764-778.
  12. Dijkstra, T., Van Heuven, W.J.B., & Grainger, J. (1998). Simulating cross-language competition with the bilingual interactive activation model. Psychologica Belgica, 38, 177-196.
  13. Dijkstra, A.F.J., & Van Heuven, W.J.B. (2002). The architecture of the bilingual word recognition system: From identification to decision. Bilingualism: Language and Cognition, 5 (3), 175-197.

Liens internes

Liens externes



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Reconnaissance des mots de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Taux de reconnaissance de mots — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… …   Wikipédia en Français

  • Guerre des mots dans le conflit israélo-palestinien — La guerre des mots dans le conflit israélo palestinien est la guerre médiatique et les « disputes » auxquelles se livrent militants proisraéliens et propalestiniens autour des événements du Proche Orient. Elle pèse particulièrement dans …   Wikipédia en Français

  • Histoire Des Mots Wallons Et Wallonie — Histoire du terme Wallon L histoire du terme Wallon et de ses dérivés commence avec le très ancien mot germanique Walh, qui désigne en général les populations de langues celtiques ou romanes avec lesquelles les Germains avaient des contacts, mais …   Wikipédia en Français

  • Histoire des mots Wallons et Wallonie — Histoire du terme Wallon L histoire du terme Wallon et de ses dérivés commence avec le très ancien mot germanique Walh, qui désigne en général les populations de langues celtiques ou romanes avec lesquelles les Germains avaient des contacts, mais …   Wikipédia en Français

  • Histoire des mots wallons et wallonie — Histoire du terme Wallon L histoire du terme Wallon et de ses dérivés commence avec le très ancien mot germanique Walh, qui désigne en général les populations de langues celtiques ou romanes avec lesquelles les Germains avaient des contacts, mais …   Wikipédia en Français

  • Association pour la reconnaissance des auteurs de langue française — L ARALF est une association pour la reconnaissance des auteurs de langue française. Historique Dans les années 1970, l’ARALF, c’est d’abord des amoureux du théâtre et du cinéma qui se réunissent pour écrire des scénarios et pour se lire leurs… …   Wikipédia en Français

  • Reconnaissance de l'écriture manuscrite — La reconnaissance de l’écriture manuscrite est un traitement informatique qui a pour but de traduire un texte écrit en un texte codé numériquement. Il faut distinguer deux reconnaissances distinctes, avec des problématiques et des solutions… …   Wikipédia en Français

  • Reconnaissance de la parole — Reconnaissance vocale Pour les articles homonymes, voir ASR. La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d analyser un mot ou une phrase captée …   Wikipédia en Français

  • reconnaissance — [ r(ə)kɔnɛsɑ̃s ] n. f. • 1538; reconissance « gratitude » 1180; reconuisance « signe de ralliement » 1080; de reconnaître I ♦ Fait de reconnaître, d identifier un objet, un être comme tel; ce qui sert à reconnaître. 1 ♦ Acte de juger qu un objet… …   Encyclopédie Universelle

  • Reconnaissance d'écriture — Reconnaissance de l écriture manuscrite La reconnaissance de l’écriture manuscrite est un traitement informatique qui a pour but de traduire un texte écrit en un texte codé numériquement. Il faut distinguer deux reconnaissances distinctes, avec… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”