Codage des caracteres chinois

Codage des caracteres chinois

Codage des caractères chinois

Sinogramme
漢字 - 汉字

Tracé :

Sémantique :

Emploi :

Pour d'autres régions :

Aide pour l'encodage
Bibliographie

Le sigle CJC désigne les écritures chinoise, japonaise et coréenne, qui utilisent toutes les trois les caractères Han, caractères chinois dits hanzi en chinois, kanji en japonais, ou hanja en coréen, ainsi que des caractères nationaux. La polémique concerne surtout le chinois simplifié (de République populaire de Chine et, officiellement Singapour et Hong-Kong), le chinois traditionnel (à Taïwan, Singapour, Hong-Kong et en Corée) et le japonais.

Ces caractères idéographiques ont évolué au fil des siècles dans ces différents pays et ont aujourd’hui des tracés bien différents. Les Chinois continentaux les ont beaucoup simplifiés, les Japonais y ont apporté des modifications mineures, tandis que les pays ou villes utilisant le chinois traditionnel ont gardé les caractères d’origine sans aucune modification. Les Japonais y ont ajouté leurs syllabaires hiragana et katakana et les Coréens leur alphabet hangûl, mais ceux-ci étant codés séparement dans Unicode, leur utilisation informatique ne pose pas problème.

Le sens ayant également devié, la prononciation elle-même étant différente, de nombreux linguistes asiatiques considèrent ces caractères comme étant bien différents.

Cependant, le Consortium Unicode et l’ISO (ainsi que le groupe de travail UniHan dont font partie les autorités de normalisations chinoises, japonaises et coréennes, et qui est en charge de l’identification et l’unification des très nombreux caractères idéographiques avant leur normalisation par l’ISO et Unicode...) considèrent que les caractères chinois, coréens et japonais sont les mêmes, que seuls les glyphes (œils en français) diffèrent. La différence serait comparable aux langues latines : traditionnellement en allemand la police de caractères gothique est privilégiée, en français une police à sérifs et en anglais une police sans sérifs. Par conséquent, ils sont codés de la même façon et il faut utiliser une police appropriée pour afficher les caractères dans le style qui convient le mieux aux habitudes locales.

Par conséquent :

  • Il est impossible de savoir dans quelle langue est écrit un caractère (donc quel glyphe utiliser pour le représenter), ce n’est d’ailleurs pas un problème unique au CJC (comment savoir si un A est allemand ou français ?),
  • mélanger japonais et chinois (par exemple, en citant une parole de Confucius dans sa langue dans un ouvrage japonais) dans un texte non balisé ou sans utiliser les étiquettes linguistiques d'Unicode peut poser des problèmes d'esthétique,
  • un ouvrage concernant le japonais ancien unifiera des caractères qui n'existent plus dans la langue moderne mais font appel à des concepts bien différents pour un spécialiste.

Pour cette raison, beaucoup de Japonais refusent de voir en Unicode un système de codage universel. Un professeur de l'université de Tokyo a d'ailleurs proposé un nouveau système de codage intégré à un système d'exploitation embarqué : TRON. Celui-ci permet de coder tous les caractères existant ou ayant existé, ce qui est utile pour les linguistes ou historiens japonais citant les caractères disparus dans leurs publications.

Face à ces critiques toutefois, Unicode vient d’ouvrir un répertoire de variantes normalisées, qui permettront de différencier (de façon optionnelle) les idéographes unifiés quand cela sera nécessaire. Ce répertoire additionnel ne nécessite pas d’ajout de caractères supplémentaires dans Unicode ou ISO/IEC 10646 et ne compromet pas le travail d’unification réalisé (la norme Unicode référence déjà des variantes graphiques pour les symboles à usage mathématique).

Mais ouvrir la porte complètement à des variantes graphiques codées différemment est inacceptable car cela poserait de nombreux problèmes d’interopérabilité des documents qui, dès lors, dépendraient de polices de caractères spécifiques, puisque les glyphes sont l’objet de protections de propriété intellectuelle. Cela compromettrait totalement la norme et rendrait quasiment impossible la conversion de données de sources différentes, chacune utilisant ses propres polices de caractères. La solution du codage de variantes graphiques est ouverte caractère par caractère, mais uniquement dans les cas où la différenciation est nécessaire pour permettre un rendu correct et lisible des textes codés.

Voir aussi

Blocs de caractères Unicode pour l’écriture idéographique CJC

  • Portail du Japon Portail du Japon
  • Portail du monde chinois Portail du monde chinois
  • Portail de l’informatique Portail de l’informatique
  • Portail de l’écriture Portail de l’écriture
Ce document provient de « Codage des caract%C3%A8res chinois ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Codage des caracteres chinois de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • Codage Des Caractères Chinois — Sinogramme 漢字 汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs Dictionnaires chinois …   Wikipédia en Français

  • Codage des caractères chinois — Sinogramme 漢字 汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs Dictionnaires chinois… …   Wikipédia en Français

  • Codage des caractères — Pour l action de cacher le sens de l information, voir chiffrement. En télécommunications et en informatique, un jeu de caractères codés est un code qui associe un jeu de caractères abstraits d’un ou plusieurs systèmes d’écriture (comme des… …   Wikipédia en Français

  • Codage De Caractères — Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD… …   Wikipédia en Français

  • Codage de caracteres — Codage de caractères Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC… …   Wikipédia en Français

  • Codage de caractères — Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD… …   Wikipédia en Français

  • Caractères chinois — Sinogramme Pour les articles homonymes, voir Sinogramme (homonymie). hànzì 漢字 (écriture traditionnelle) et hànzì 汉字 (écriture simplifiée) Les sinogrammes, ou carac …   Wikipédia en Français

  • Caractères chinois simplifiés — Sinogramme simplifié Sinogramme 漢字 汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs… …   Wikipédia en Français

  • Caractères chinois traditionnels — Sinogramme traditionnel Sinogramme 漢字 汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs …   Wikipédia en Français

  • Styles de caractères chinois — Sinogramme 漢字 汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs Dictionnaires chinois… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”