Texte bi-directionnel

Texte bi-directionnel

Texte bi-directionnel

Unicode
Jeux de caractères
Équivalences normalisées
  • NFC (précomposée)
  • NFD (décomposée)
  • NFKC (compatibilité)
  • NFKD (compatibilité)
Propriétés et algorithmes
Codage
Autres transformations
Applications d'échanges de données

Certains systèmes décritures, tels que lalphabet arabe et hébreu, sécrivent de droite à gauche (Right-To-Left, RTL, en anglais). Dans ce cas, le texte commence du côté droit de la page et se termine du côté gauche, au contraire du sens décriture conventionnel de gauche à droite (Left-To-Right, LTR) des langues utilisant lalphabet latin (telles que le français). Lorsquun texte LTR est mélangé avec un texte RTL dans le même paragraphe, chaque type de texte doit être écrit dans son propre sens, phénomène connu sous le nom de texte bidirectionnel.

Sommaire

Systèmes décriture

Cela peut devenir relativement complexe, lorsque plusieurs niveaux de citations sont utilisés. La plupart des systèmes décriture originaires de Moyen-Orient sont de cette nature. Par exemple, le nom hébreu Sarah (שרה) doit être épelé shin (ש), resh (ר), heh (ה) de droite à gauche.

Très peu décritures peuvent être écrites dans les deux sens. Cétait le cas des hiéroglyphes égyptiens, lon employait un hiéroglyphe « tête », orientée dans le sens de lecture, marquant le début dune ligne, et un hiéroglyphe « queue » pour marquer la fin. Lorientation des hiéroglyphes renseigne sur le sens de lecture : les figures (par exemple les oiseaux) « regardent » en effet vers le début de la ligne.

Certaines inscriptions grecques, touaregs, et runiques hongroises ont utilisé un système original, appelé boustrophédon, dans lequel le sens de lecture est inversé à chaque ligne.

Support décriture bidirectionnel

Le support décriture bidirectionnel (en anglais bidirectional script support) est la capacité dun logiciel à afficher correctement le texte bidirectionnel. Dans le jargon informatique, on abrège ce terme par BiDi ou bidi. Peu de logiciels affichent correctement les textes bidirectionnels. Certains navigateurs Web peuvent afficher le texte hébreu de cet article en sens inverse.

Les premiers systèmes informatiques étaient conçus pour ne prendre en charge quun unique sens décriture, en particulier le sens LTR (ainsi quune unique fonte basée sur lASCII et lalphabet latin). Lajout de nouveaux jeux de caractères et dencodages a permis le support dautres écritures de gauche à droite, mais peu aisément de droite à gauche, par exemple pour larabe ou lhébreu, et le mélange des deux irréalisable. Le support bidirectionnel a permis dutiliser les deux sens décriture dans une même page, voire dans un même paragraphe.

En particulier, le standard Unicode fournit des bases pour un support BiDi complet, avec des règles détaillées définissant comment doivent être enchaînés les textes de droite à gauche et de gauche à droite pour leur codage et affichage. En codage Unicode, tous les caractères sont stockés dans lordre décriture, et le logiciel trouve dans quelle direction le texte doit être affiché.

Subtilités techniques en Unicode

Les niveaux

Les morceaux de textes sont numérotés en fonction de leur niveau dimbrication. Le niveau 0 est du simple texte français, le niveau 1 est du simple texte arabe, possiblement embarqué à lintérieur de texte français de niveau 0. Le niveau 2 est du texte français, possiblement embarqué à lintérieur de texte arabe de niveau 1, et ainsi de suite.

Sauf exceptions, le texte et les nombres français seront toujours dun niveau pair ; les textes arabes (à lexception des nombres) seront dun niveau impair.

Exemple

En notant par des majuscules le texte de droite à gauche (arabe), et par des minuscules, le texte de gauche à droite (comme le français, ou le catalan).

Représentation mémoire : un texte TEXTE ARABE en français
Types des caractères  :  LL-LLLLL-RRRRR-RRRRR-LL-LLLLLLLL
Niveau :                 00000000011111111111000000000000

Les caractères neutres (espaces) entre TEXTE et ARABE prennent par défaut le niveau des caractères les entourant. Des marques directionnelles peuvent être ajoutées autour des caractères neutres, afin den changer leur effet.

Marques de sens décriture

Alors que le sens décriture est détecté automatiquement, des marques de contrôle sont prévues afin de pouvoir changer le sens décriture.

Le marqueur de gauche à droite a le code hexadécimal 200E. Le marqueur de droite à gauche a le code hexadécimal 200F.

Dautres marqueurs existent, en particulier entre les valeurs 202A et 202E.

Caractères miroir

Certains caractères apparaissent dans leur forme miroir lorsquils sont écrits de droite à gauche.

Par exemple, la parenthèse gauche U+0028 qui est interprétée par le standard Unicode comme une parenthèse ouvrante apparaît comme « ( » quand elle est résolue en tant que paire, et comme son glyphe miroir « ) », lorsquelle est considérée comme impaire.

Voir aussi

Articles connexes

Liens externes

  • Portail de l’informatique Portail de linformatique
  • Portail de l’écriture Portail de lécriture
Ce document provient de « Texte bi-directionnel ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Texte bi-directionnel de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • Logiciel De Traitement De Texte — Un logiciel de traitement de texte est un programme informatique permettant de faire du traitement de texte. Sommaire 1 Les types de logiciel 1.1 Éditeur de texte 1.2 Traitement de texte interactif …   Wikipédia en Français

  • Logiciel de traitement de texte — Ecran du traitement de texte OpenOffice.org Writer …   Wikipédia en Français

  • Traitement de texte automatique — Logiciel de traitement de texte Un logiciel de traitement de texte est un programme informatique permettant de faire du traitement de texte. Sommaire 1 Les types de logiciel 1.1 Éditeur de texte 1.2 Traitement de texte interactif …   Wikipédia en Français

  • Traitement de texte interactif — Logiciel de traitement de texte Un logiciel de traitement de texte est un programme informatique permettant de faire du traitement de texte. Sommaire 1 Les types de logiciel 1.1 Éditeur de texte 1.2 Traitement de texte interactif …   Wikipédia en Français

  • Encodage texte — Codage de caractères Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC… …   Wikipédia en Français

  • Représentation du texte en informatique — Codage de caractères Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC… …   Wikipédia en Français

  • BiDi — Texte bi directionnel Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • De droite à gauche — Texte bi directionnel Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • De gauche à droite — Texte bi directionnel Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Point de code — Unicode Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

Share the article and excerpts

Direct link
https://fr-academic.com/dic.nsf/frwiki/1616663 Do a right-click on the link above
and select “Copy Link”