- Rime syllabique
-
Syllabe
La notion de syllabe est difficile à cerner, pour une bonne raison : elle varie selon la langue à analyser. Plusieurs approches sont possibles pour tenter de la définir. On peut, pour l'instant, se contenter de dire qu'un locuteur lambda est capable de découper un mot en syllabes dans sa langue, sans forcément savoir comment il procède. Une syllabe est composée d’un ou plusieurs phonèmes et un mot est formé d’une ou plusieurs syllabes.
Sommaire
Définition acoustique : le sommet de syllabe
En phonétique acoustique, on analyse les sons émis par le gosier avec des appareils donnant des informations techniques (intensité, durée, fréquence, formants etc.). Tous les phonèmes n'ont pas la même intensité, les phonèmes les moins intenses étant les consonnes sourdes occlusives ([p], [t], [k], [q], [c] etc.), les plus intenses les voyelles ouvertes ([a], [ɑ], [ɶ] et [ɒ]).
H. A. Gleason, dans son Introduction à la linguistique, définit la syllabe comme étant liée à l'activité des muscles intercostaux, ceux qui permettent la respiration en rapprochant puis éloignant les parois de la cavité thoracique. Selon l'intensité naturelle des phonèmes émis, les déplacements sont plus ou moins importants. L'émission de la parole est donc constituée d'une alternance de déplacements plus ou moins importants d'air. Là où, dans le flux, l'intensité connaît un pic, l'on est en présence d'un sommet de syllabe. Il est aussi possible de définir le sommet de syllabe comme un son (dont on peut donner la hauteur) tandis que les autres phonèmes sont des bruits.
Or, les sons susceptibles d'être les plus intenses sont, dans l'ordre croissant :
- les nasales et latérales : [n], [m], [ŋ], [ɲ], [ɳ], [ɴ] etc. ;
- les vibrantes : [ʙ], [r], [ʀ] etc. ;
- les voyelles fermées : [i], [y], [ɨ], [ʉ], [ɯ] et [u] ;
- les voyelles mi-fermées : [e], [ø], [ɘ], [ɵ], [ɤ] et [o] ;
- les voyelles mi-ouvertes : [ɛ], [œ], [ɜ], [ɞ], [ʌ] et [ɔ] ;
- les voyelles ouvertes : [a], [ɑ], [ɶ] et [ɒ].
Tous ces sons possèdent un point commun : ils sont continus (on peut en maintenir la production tant qu'il reste du souffle) et ils sont voisés (les cordes vocales vibrent en les produisant). Semblent donc exclus les phonèmes momentanés (comme les occlusives) et les phonèmes sourds.
Ainsi, l'on considère un flux parlé comme une courbe d'intensités diverses, de creux et de bosses. Le sommet des bosses correspond aux sommets de syllabes et possède une hauteur donnée : à chaque pic d'intensité, on trouve un sommet de syllabe, qui est la plupart du temps représenté par une voyelle, mais qui peut l'être par d'autres phonèmes, qui sont alors dits « vocalisés », c'est-à-dire qu'ils jouent le rôle du sommet de syllabe. Les autres sons, s'apparentant aux bruits, sont donc souvent moins intenses et, surtout, n'ont pas de hauteur clairement définissable. Pour s'en rendre compte, il suffit de chanter : si l'on veut suivre une mélodie, il est nécessaire d'émettre des sons qui ne sont pas forcément des voyelles (si l'on chante bouche fermée, ce seront des nasales vocalisées, on peut aussi chanter sur [zzzz]) mais des sommets de syllabes. Ne chanter qu'avec des consonnes momentanées (comme [p], [d], [k]) ou sourdes (comme [f], [t]) n'est pas possible (sauf dans le cas des consonnes vocalisées). Ainsi, l'air d'Au clair de la lune peut être chanté normalement, dans une suite de sons et de bruits, ou bien seulement avec des voyelles ou encore bouche fermée. Il n'est cependant pas possible de chanter correctement cette mélodie au moyen de bruits comme [f] ou [k].
Prenons une langue comme le français : seules les voyelles jouent le rôle de sommet vocalique (car il n'y existe pas de sonante vocalisée : pas de [n̩] ou de [r̩], au contraire de l'anglais, du sanskrit ou encore du croate). Ainsi, pour savoir combien de syllabes compte un mot français, il suffit de compter le nombre de voyelles, qui formeront les sommets syllabiques (on séparera les syllabes par des points) :
- strict, et dextre :
- [stʁ̥ikt] : une voyelle, [i], donc une syllabe ;
- [dɛkstʁ̥] : idem, avec [ɛ] comme sommet.
Les consonnes finales de ces mots sont parmi les plus faibles en intensité ; elles ne peuvent pas jouer le rôle de sommet.
Si l'on ajoute un e caduc (lors de la lecture de vers, par exemple, devant consonne), on ajoute une voyelle, donc une syllabe :
- [dɛkstʁ̥ǝ] : deux voyelles = deux syllabes [dɛk.stʁ̥ǝ]
Autres exemples (les sommets sont soulignés ; /C/ représente « toute consonne », /V/ « toute voyelle ») :
- poésie [pɔezi] : trois voyelles = trois syllabes [pɔ.e.zi] = /CV.V.CV/ ;
- néon [neɔ̃] : deux voyelles = deux syllabes [ne.ɔ̃] = /CV.V/ ;
- peuple [pœpl̥] : une voyelle = une syllabe [pœpl̥] = /CVCC/ ;
- strophe [stʁ̥ɔf] : une voyelle = une syllabe [stʁ̥ɔf] = /CCCVC/
Dans d'autres langues, il est possible de placer autre chose qu'une voyelle comme sommet de syllabe ; ce sont alors des consonnes vocalisées, « utilisées comme voyelle », mais la plupart du temps des sonantes (ici représentées par /S/) :
- sanskrit vr̥kas [vr̩.kɐs] : deux sommets = deux syllabes = /CS.CVC/ ;
- anglais little [lɪ.tl̩] : deux sommets = deux syllabes = /CV.CS/ ;
- anglais written [ɹɪ.tn̩] : idem : /CV.CS/ ;
- anglais day [dei] : une voyelle complexe (ici une diphtongue) = une syllabe = /CVV/ ; dans le cas des diphtongues, un seul des timbres constituants, dit « timbre cible », reçoit le maximum d'intensité et forme le sommet syllabique.
Si toutes les voyelles d'une diphtongues reçoivent la même intensité, ce n'est plus une diphtongue mais une suite de voyelles ; il n'y a pas de diphtongues en français mais bien des suites de voyelles :
- abeille [a.bɛj] : deux voyelles = deux syllabes = /V.CVC/ ;
- abbaye [a.bɛ.i] : trois voyelles = trois syllabes : /V.CV.V/.
Dans de rares langues (certaines langues du Caucase, berbères, amérindiennes), une syllabe peut même ne posséder aucune voyelle ni consonne vocalisée et n'être qu'une suite monosyllabique de consonnes sourdes momentanées. L'une d'entre elles, cependant, reçoit un pic d'intensité qui permet de repérer le sommet. La plupart du temps, une voyelle épenthétique est insérée pour faciliter la prononciation. En sorte, les syllabes sans phonème continu n'existent quasiment pas.
Segmentation
Reste ensuite à déterminer ce qui entre ou non dans la syllabe en question ; en effet, si l'on peut acoustiquement savoir où sont les sommets des syllabes, c'est-à-dire compter le nombre de syllabes d'un énoncé, il faut ensuite répartir les phonèmes situés avant et après : appartiennent-il à la syllabe en question, à celle d'avant ou celle d'après ? Pour cela, la structure phonologique de la langue que l'on analyse compte : si les sommets sont visibles avec un appareil, il faut se référer au système phonologique de la langue pour savoir ce qui appartient à une syllabe, c'est-à-dire pour répartir convenablement ce qui se trouve de part et d'autre des sommets.
Ainsi, en peul, chien se dit rawaandu ; pour un francophone ne connaissant pas la phonologie du peul, le découpage se fait ainsi : [ra.waːn.du]. Pour un Peul, cependant, c'est [ra.waː.ⁿdu] (notez le [ⁿ]). Dans le système phonologique du peul, en effet, il existe des consonnes dites « prénasalisées », c'est-à-dire qu'elles commencent comme des nasales mais finissent comme des consonnes (de la même manière, en mandarin, l'initiale de 幾 jǐ [ʨi] n'est qu'une seule consonne, dite « affriquée », qui commence comme une occlusive et finit comme une fricative et non une suite de deux consonnes).
Il existe donc en peul une consonne [n], une consonne [ⁿd] et des rencontres de consonnes [n]+[d], qui ne sont pas entendues de la même manière par un natif : [ⁿd] dure moins longtemps que [n]+[d]. L'explication en est simple : [n]+[d] forment deux consonnes de durée normale, [ⁿd] une seule, de durée normale. Dans un terme qui serait de forme [a.ⁿda], on trouve une consonne, dans [an.da] deux. Le mot est plus long quand il est prononcé [an.da] que lorsque c'est [a.ⁿda] ; un francophone ne fera sans doute pas la différence, un Peul si.
En conclusion, seule la connaissance des phonèmes d'une langue ainsi que celle des contraintes de construction de ces phonèmes en syllabes permettent de savoir comment couper les mots.
Contraintes syllabiques
La segmentation en syllabes d'un énoncé ne peut être correcte que si l'on connaît les contraintes de formation syllabique de la langue à analyser. Leur étude constitue la phonotactique.
Éléments d'une syllabe
Une syllabe peut se décomposer en trois éléments :
- attaque : consonne(s) précédant le noyau
- rime, elle même composée de :
- noyau ou sommet de la syllabe: généralement une voyelle, une diphtongue ou une triphtongue ;
- coda : consonne(s) suivant le noyau.
La syllabe française dextre [dɛkstʁ̥] s'analyse donc ainsi :
Attaque Rime noyau coda d ɛ kstʁ̥ On dit d'une syllabe possédant une coda qu'elle est fermée, sans coda qu'elle est ouverte.
Dans les langues possédant des syllabes brèves opposées à des syllabes longues (voir Quantité syllabique), chaque élément d'une syllabe longue est nommée more.
Contraintes de quantité
Établir la liste des contraintes syllabiques d'une langue revient à indiquer le nombre et l'identité des phonèmes par rapport aux éléments de la syllabe. Ainsi, en français, l'attaque et la coda peuvent être nulles ; y [i] (adverbe de lieu) vaut :
- attaque : Ø ;
- noyau : [i] ;
- coda : Ø.
Ce n'est pas le cas en arabe, où l'attaque est obligatoirement présente : cela revient à dire que toute syllabe doit commencer par une consonne ; اللّٰه ʾAllāh [ʔallaːh] s'analyse :
- syllabe 1 ʾal :
- attaque : [ʔ],
- noyau : [a],
- coda : [l],
- syllabe 2 lāh :
- attaque : [l],
- noyau : [aː],
- coda : [h].
En japonais, la coda doit être une nasale ou bien nulle (si l'on fait abstraction d'une prononciation plus rapide dans laquelle certaines voyelles atones, en l'occurrence u et i, peuvent s'amuïr) : le mot です de.su, « c'est », est possible, mais non *desut. D'ailleurs, です est un exemple où existe l'amuïssement du u, donnant des' .
Il est donc possible d'indiquer la structure quantitative des syllabes, c'est-à-dire le nombre maximal de phonèmes à l'attaque et à la coda : en français, la syllabe théorique la plus lourde est de la forme CCCVCCCC (CCCV... dans strict, ...VCCCC dans dextre ; aucun mot, cependant, ne forme une syllabe CCCVCCCC). En polonais, la syllabe la plus lourde peut être encore plus importante : CCCCCVCCCCC (CCCCCV... dans źdźbło [ʑḏʑbwɔ] « lame », ...VCCCCC dans la deuxième syllabe de przestępstw [pʃɛstɛmpstʍ] « transgression » (génitif pluriel)). En japonais, cependant, la syllabe la plus lourde ne peut dépasser CVN (où N est une nasale). Le tahitien est encore plus limité, puisque toutes les syllabes doivent être ouvertes ; la syllabe lourde y vaut CV.
Il faut aussi considérer la place de la syllabe par rapport au mot : en turc, par exemple, CCV... est impossible en début de mot ; aucune syllabe initiale ne peut donc commencer par deux consonnes, ce qui explique les nombreux cas de prosthèse : station [stasjɔ̃] devient istasyon, pour éviter que la première syllabe ne soit à deux consonnes initiales. Des langues romanes comme le castillan suivent ce principe : spécial s'y dit especial. Le français, dans des états antérieurs, possédait la même contrainte, ce qui explique que le latin stella ait donné étoile.
Contraintes de qualité
En arabe et en français, chaque phonème de la langue peut intervenir dans n'importe quel élément. Dans d'autres, les phonèmes se répartissent selon la place qu'ils occupent : en mandarin, la coda ne peut être réalisée que comme une nasale [n] ou [ŋ]. Le même phonème [ŋ] ne peut cependant pas occuper la place de l'attaque. Cela revient à dire qu'aucun mot ne peut commencer dans cette langue par un [ŋ] et qu'aucun mot ne peut finir par un [t]. Dans ce cas, le nombre total de syllabes que la langue peut produire est limité et dénombrable.
Les langues à tendances monosyllabiques telles que les dialectes chinois mais aussi le birman, le vietnamien et de nombreuses langues de l'Asie du Sud-Est, fonctionnent selon ce principe.
Études de contraintes syllabiques
- la syllabe castillane ;
- la syllabe en mandarin.
Articles connexes
Catégorie : Phonétique suprasegmentale
Wikimedia Foundation. 2010.