- Langage naturel
-
Un langage naturel, ou « langage ordinaire », est une langue « normale » parlée par un être humain. Il s'oppose au langage formel tel qu'en informatique avec le langage informatique.
Sommaire
Linguistique
On désigne par langage naturel le langage parlé entre il y a 200 000 ans et il y a 50 000 ans par les hommes. Il est détaillé par l'histoire des langues. Après 2 millions d'années de gestation par l’Homo erectus, qui a pris la suite de l'Homo habilis, l’homme moderne, appelé Homo sapiens est apparu par la conjonction de nombreux facteurs :
- la maitrise du feu (environ 500 000 ans avant notre ère) qui a permis d'alimenter un cerveau de taille croissante (au dessus de 500 cm3)[1] ;
- l'altricialité secondaire qui a permis au nourrisson de passer de 60% du cerveau à la naissance à moins de 25% et d'atteindre, après 10 ans de maturation, des volumes de cerveau de 1400 cm³ et plus ;
- la préexistence d’une proto-langue chantée par l'un des prédécesseurs de cette race : l'homme de Néandertal (the singing Neandertal[AOdledl 1]), né il y a environ 400 000 ans[AOdledl 1], qui, au niveau de connaissance actuelle, ne possédait pas de syntaxe ;
- une mutation génétique de plusieurs gènes dominants, qui ont développé la capacité cognitive[Notes 1], dont celui qui est dit de la parole FOXP2[AOdledl 2]- Il faut noter que le gène FOXP2 prend des formes variables selon les espèces[2]. Et ce gène, dans la forme humaine, a donné la capacité pour l’homme de passer des mots à la syntaxe (ce facteur n’est pas suffisant en lui-même car il existe chez d’autres espèces sans donner naissance à la parole: mais nous ne savons pas si les différents formes de gène sont identiques) ; il faut mentionner que ces gènes seraient à l’origine (voir à ce sujet la théorie de Jean Pierre Changeux[3],[4]) de la maturation de l’aire de Broca et de l’aire de Wernicke[Notes 2] ;
- l’augmentation de la masse de l’encéphale[AOdledl 2] continue de l’Homo habilis à l’Homo sapiens ;
- le redressement du pharynx[AOdledl 3] qui a permis la vocalisation plus poussée de la parole.
Il y a deux scénario d’apparition de l’Homo sapiens, le scénario « Out of Africa » et un scénario pluri-centripète (polygenèse), mais les recherches récentes[Notes 3],[AOdledl 4] en paléo-linguistique ont identifié un fond de 27 mots communs à la racine de toutes les langues terrestres écrites au début du XXIe siècle, ce qui pousse à favoriser le scénario « Out of Africa » (monogenèse), en effet, plusieurs sources n’auraient pas eu de raison d’adopter la même proto-langue de départ.
Ultérieurement l’Homo sapiens s'est imposé au sein de la race humaine, soit du fait de l’hypothèse productiviste[5], soit du fait de l’hypothèse sociologique[AOdledl 5].
Ce langage a pris depuis environ 7 000 ans une forme écrite dans un certain nombre de langues qui se sont alors imposées comme les langues dominantes. 6 000 langues sont principalement de ce fait en danger d’extinction.
Les langages informatique
En informatique, le langage naturel s'oppose au langage informatique :
- langages machine : directement interprétables par le processeur d'un ordinateur, mais peu lisibles aux yeux du programmeur
- langages de programmation : compréhensibles par le programmeur et aisément traductibles (compilables) en langage machine
- langages formels : définis à partir d'un alphabet et d'un certain nombre de règles formelles
Le défi que souhaitent relever les éditeurs de moteurs de recherche est de pouvoir donner des résultats pertinents à une requête formulée en langage naturel.
Alan Turing, mathématicien britannique de la première moitié du XXe siècle, a par ailleurs conjecturé qu'une intelligence artificielle pouvait tellement bien donner l'impression de « parler » qu'elle serait difficile à discerner d'un être humain. On appelle tests de Turing les tests d’intelligence artificielle ayant la faculté d’imiter la conversation humaine.
Cohérence du langage naturel
Si la cohérence d’un texte est la propriété d’un texte qui ne demande pas de déduction pour passer d’un élément documentaire au suivant, nous utiliserons l’exemple de Florian Wolf et al.[6] pour illustrer cette propriété :
- Le temps établi sur le site de lancement spatial de Kourou hier était beau.
- De ce fait, le lancement du nouveau lanceur Ariane s’est effectué conformément au planning.
- Et le lanceur a mis deux satellites sur orbite.
Les inférences à faire pour comprendre le texte sont ici triviales, respectant le principe de pertinence dans la transmission d’information. Elles sont progressives. Il faut du beau temps pour lancer une fusée, et le lanceur Ariane peut lancer deux satellites. Encore faut il caractériser ces inférences : « le temps était beau et de ce fait » explicite la première inférence, et « le lanceur Ariane (…) a mis deux satellites sur orbite » explicite la deuxième inférence. On ne sait pas si le lanceur peut lancer quatre satellites, mais ce n’est pas le sujet. Il faut être conscient de la nécessité de tous les mots dans ce texte.
En outre la progression est respectée : on parle du temps qu’il fait, puis du lancement de la fusée et enfin de ce qui est lancé.
Retirez de ce texte l'adjectif spatial accolé au nom centre et nous ne savons plus justifier sa cohérence. Il faut alors faire une inférence moins explicite : le centre de Kourou est un centre spatial. Il faut pour ce faire se pencher sur la théorie de la pragmatique pour évaluer le coût de cette inférence. Il faut noter que le principe de pertinence évolue fortement qu'on soit dans un langage écrit où les préétablis sont faibles ou dans le langage oral où le préétabli est important sachant que le l'auteur connaît une part des connaissances de son auditeur.
Il faut reconnaître que de nombreux textes ne satisfont pas cette propriété : ainsi Michel Charolles[7] consacre de nombreux documents à inventorier ces situations d’ambiguïté dans les textes :
- dans le texte « On sonne. Je suis dans mon bain. » il y a de nombreuses connexions à établir pour arriver à la cohérence ;
- quant au texte « Le studio de Marc donnait sur une place très fréquentée. Le bruit était épouvantable. Paul passa la soirée sur un banc au bord de l’océan. Le vent soufflait. Il allait pleuvoir. » il est donné comme un exemple d’ambiguïté : soumis a un panel de lecteurs, les interprétations vont de « il y a un appartement bruyant et « bizarrement » un certain Paul passe une soirée au bord de la mer » à « Paul, seul occupant du studio, est triste de devoir y aller le lendemain à cause du mauvais temps ».
Ces exemples mettent en exergue la notion de profondeur du traitement implicite que ces textes demandent pour atteindre la cohérence.
Notes et références
Notes
- Max Planck. En Juillet 2006, l'Institut et 454 Life Sciences ont annoncé qu'elles entreprenaient le séquençage du génome de l'homme de Néandertal. Composé de trois milliards de paires de base, le génome de l'homme de Néandertal est à peu près de la taille du génome humain et a probablement de nombreux gènes identiques. On pense que la comparaison du génome de l'homme de Néandertal et du génome humain permettra de mieux connaître cette espèce disparue, ainsi que l'évolution de l'homme et du cerveau humain. Institut Max-Planck d'anthropologie évolutionniste Voir à ce sujet les recherches des généticiens de l'Institut
- XIXe siècle et aucune preuve d'activation de ces zones n'est donnée pour d'autres espèces d’Homo que l’Homo sapiens Ces zones ont été identifiées à la fin du
- http://www.tlfq.ulaval.ca/axl/monde/origine-langues.htm
Aux Origines des langues et du langage, sous la direction de Jean-Marie Hombert, Fayard, 2005
Références issues de Aux Origines des langues et du langage, sous la direction de Jean-Marie Hombert, Fayard, 2005
- Jean-Jacques Hubelin – La Langue des premiers hommes
- Philippe Vernier – Évolution du cerveau et émergence du langage
- Christophe Coupé – À la Recherche des indices du langage articulé
- Christophe Coupé – L’impossible Quête de la Langue Mère
- Bernard Victorri – Les Mystères de l’émergence du langage
:
Autres
- Cécile Lestienne, Ghislain Dehanne, Laurent Sagart, Pascal Picq - La plus belle histoire du langage, Seuil, 2008.
- [1] Alec MacAndrew - FOXP2 and the Evolution of Language
- Jean-Pierre Changeux - L'homme neuronal, Fayard, Paris, 1983.
- Jean-Pierre Changeux - propriété des ensembles neuronaux dans Théories du langage et théories de l'apprentissage, Édition du seuil, Paris, 1979.
- Joseph Donato – La Variation linguistique dans Linguistique sous la direction de Fréderic François, PUF, 1980.
- Fabien Wolf et Edward Gibson – Coherence dans Natural Language, Massachusetts Institute of Technology, 2006.
- Michel Charolles - Cohérence, pertinence et intégration conceptuelle, Université de Paris III, 2002.
Voir aussi
Wikimedia Foundation. 2010.