Codage des caractères chinois

Codage des caractères chinois: Sinogramme
漢字 - 汉字

Tracé :

Composition graphique

Nombre et ordre des traits

Styles de caractères chinois

Calligraphie extrême-orientale

Sémantique :

Types de caractères

Radicaux ou clefs

Liste des radicaux ou clefs

Dictionnaires chinois

Codage des caractères chinois

Emploi :

Sinogrammes traditionnels

Sinogrammes simplifiés

Géographie des sinogrammes

Son et sens des caractères

Variantes graphiques

Pour d'autres régions :

Cantonais : Honzi et Zukzi

Corée : hanja

Japon : Kanji

Vietnam : chữ nho et chữ nôm

Aide pour l'encodage Bibliographie

Le sigle CJC désigne les écritures chinoise, japonaise et coréenne, qui utilisent toutes les trois les caractères Han, caractères chinois dits hanzi en chinois, kanji en japonais, ou hanja en coréen, ainsi que des caractères nationaux. La polémique concerne surtout le chinois simplifié (de République populaire de Chine et, officiellement Singapour et Hong Kong), le chinois traditionnel (à Taïwan, Singapour, Hong Kong et en Corée) et le japonais.

Ces caractères idéographiques ont évolué au fil des siècles dans ces différents pays et ont aujourd’hui des tracés bien différents. Les Chinois continentaux les ont beaucoup simplifiés, les Japonais y ont apporté des modifications mineures, tandis que les pays ou villes utilisant le chinois traditionnel ont gardé les caractères d’origine sans aucune modification. Les Japonais y ont ajouté leurs syllabaires hiragana et katakana et les Coréens leur alphabet hangûl, mais ceux-ci étant codés séparément dans Unicode, leur utilisation informatique ne pose pas problème.

Le sens ayant également dévié, la prononciation elle-même étant différente, de nombreux linguistes asiatiques considèrent ces caractères comme étant bien différents.

Cependant, le Consortium Unicode et l’ISO (ainsi que le groupe de travail UniHan dont font partie les autorités de normalisations chinoises, japonaises et coréennes, et qui est en charge de l’identification et l’unification des très nombreux caractères idéographiques avant leur normalisation par l’ISO et Unicode...) considèrent que les caractères chinois, coréens et japonais sont les mêmes, que seuls les glyphes (œils en français) diffèrent. La différence serait comparable aux langues latines : traditionnellement en allemand la police de caractères gothique est privilégiée, en français une police à sérifs et en anglais une police sans sérifs. Par conséquent, ils sont codés de la même façon et il faut utiliser une police appropriée pour afficher les caractères dans le style qui convient le mieux aux habitudes locales.

Par conséquent :

Il est impossible de savoir dans quelle langue est écrit un caractère (donc quel glyphe utiliser pour le représenter), ce n’est d’ailleurs pas un problème unique au CJC (comment savoir si un A est allemand ou français ?),

mélanger japonais et chinois (par exemple, en citant une parole de Confucius dans sa langue dans un ouvrage japonais) dans un texte non balisé ou sans utiliser les étiquettes linguistiques d’Unicode peut poser des problèmes d'esthétique,

un ouvrage concernant le japonais ancien unifiera des caractères qui n’existent plus dans la langue moderne mais font appel à des concepts bien différents pour un spécialiste.

Pour cette raison, beaucoup de Japonais refusent de voir en Unicode un système de codage universel. Un professeur de l'université de Tokyo a d'ailleurs proposé un nouveau système de codage intégré à un système d'exploitation embarqué : TRON. Celui-ci permet de coder tous les caractères existant ou ayant existé, ce qui est utile pour les linguistes ou historiens japonais citant les caractères disparus dans leurs publications.

Face à ces critiques toutefois, Unicode vient d’ouvrir un répertoire de variantes normalisées, qui permettront de différencier (de façon optionnelle) les idéogrammes unifiés quand cela sera nécessaire. Ce répertoire additionnel ne nécessite pas d’ajout de caractères supplémentaires dans Unicode ou ISO/CEI 10646 et ne compromet pas le travail d’unification réalisé (la norme Unicode référence déjà des variantes graphiques pour les symboles à usage mathématique).

Mais ouvrir la porte complètement à des variantes graphiques codées différemment est inacceptable car cela poserait de nombreux problèmes d’interopérabilité des documents qui, dès lors, dépendraient de polices de caractères spécifiques, puisque les glyphes sont l’objet de protections de propriété intellectuelle. Cela compromettrait totalement la norme et rendrait quasiment impossible la conversion de données de sources différentes, chacune utilisant ses propres polices de caractères. La solution du codage de variantes graphiques est ouverte caractère par caractère, mais uniquement dans les cas où la différenciation est nécessaire pour permettre un rendu correct et lisible des textes codés.

Voir aussi

Blocs de caractères Unicode pour l’écriture idéographique CJC

Table des caractères Unicode - formes supplémentaires des clés CJC

Table des caractères Unicode - clés chinoises K'ang-hsi

Table des caractères Unicode - description idéographique

Table des caractères Unicode - symboles et ponctuation CJC

Table des caractères Unicode - bopomofo

Table des caractères Unicode - kanboun

Table des caractères Unicode - bopomofo étendu

Table des caractères Unicode - traits CJC

Table des caractères Unicode - lettres et mois CJC cerclés

Table des caractères Unicode - compatibilité CJC

Table des caractères Unicode - supplément A aux idéogrammes unifiés CJC : 1^re partie, 2^e partie

Table des caractères Unicode - idéogrammes unifiés CJC : 1^re partie, 2^e partie, 3^e partie, 4^e partie, 5^e partie, 6^e partie

Table des caractères Unicode - idéogrammes de compatibilité CJC

Table des caractères Unicode - formes verticales

Table des caractères Unicode - formes de compatibilité CJC

Table des caractères Unicode - formes de demi et pleine chasse

Table des caractères Unicode - supplément idéographique cerclé

Table des caractères Unicode - supplément B aux idéogrammes unifiés CJC : 1^re partie, 2^e partie, 3^e partie, 4^e partie, 5^e partie, 6^e partie, 7^e partie, 8^e partie, 9^e partie, 10^e partie, 11^e partie

Table des caractères Unicode - supplément C aux idéogrammes unifiés CJC : 1^re partie, 2^e partie

Table des caractères Unicode - supplément D aux idéogrammes unifiés CJC

Table des caractères Unicode - supplément aux idéogrammes de compatibilité CJC

Jeu de caractères supplémentaire de Hong Kong

v · Unicode
ISO/CEI 10646, Table des caractères Unicode, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, CESU-8, BOCU-1

Autres ISO/CEI 2022, Big5, ISCII, GB 18030, GBK, Shift-JIS, Codage des caractères chinois

Codés sur 8 bits

ISO/CEI 8859 ISO/CEI 8859-1 (latin-1), ISO/CEI 8859-3 (latin-3), ISO/CEI 8859-15 (latin-9)

Pages de code Windows Windows-1252 (latin-1), Windows-1258 (vietnamien)

Pages de code MacOS MacRoman

Pages de code DOS CP437 (latin-US), CP850 (latin-1), CP852 (latin-2)

Pages de code diverses DEC-MCS, KOI8-R (russe), KOI8-U (ukrainien), StandardEncoding (PostScript)

Non basés sur ISO 646 VISCII, EBCDIC, EBCDIC 297, EBCDIC 8859

Autres

Codés sur 7 bits ASCII, ISO 646

Moins de 7 bits Code morse, Code wabun, Code Baudot, RADIX-50, Sixbit

Articles connexes Codage des caractères, Clavier d’ordinateur, Police numérique, Glyphe, Portail:Écriture

Portail du Japon

Portail de l’informatique

Portail de l’écriture

Portail du monde chinois

Catégories :
Codage des données
Unicode

Contenu soumis à la licence CC-BY-SA. Source : Article Codage des caractères chinois de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

Codage Des Caractères Chinois — Sinogramme 漢字汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs Dictionnaires chinois … Wikipédia en Français
Codage des caracteres chinois — Codage des caractères chinois Sinogramme 漢字汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou … Wikipédia en Français
Codage des caractères — Pour l action de cacher le sens de l information, voir chiffrement. En télécommunications et en informatique, un jeu de caractères codés est un code qui associe un jeu de caractères abstraits d’un ou plusieurs systèmes d’écriture (comme des… … Wikipédia en Français
Codage De Caractères — Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD… … Wikipédia en Français
Codage de caracteres — Codage de caractères Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC… … Wikipédia en Français
Codage de caractères — Pour l action de cacher le sens de l information, voir chiffrement. Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD… … Wikipédia en Français
Caractères chinois — Sinogramme Pour les articles homonymes, voir Sinogramme (homonymie). hànzì 漢字 (écriture traditionnelle) et hànzì 汉字 (écriture simplifiée) Les sinogrammes, ou carac … Wikipédia en Français
Caractères chinois simplifiés — Sinogramme simplifié Sinogramme 漢字汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs… … Wikipédia en Français
Caractères chinois traditionnels — Sinogramme traditionnel Sinogramme 漢字汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs … Wikipédia en Français
Styles de caractères chinois — Sinogramme 漢字汉字 Tracé : Composition graphique Nombre et ordre des traits Styles de caractères chinois Calligraphie extrême orientale Sémantique : Types de caractères Radicaux ou clefs Liste des radicaux ou clefs Dictionnaires chinois… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Codage des caractères chinois

Voir aussi

Blocs de caractères Unicode pour l’écriture idéographique CJC

Regardez d'autres dictionnaires:

Share the article and excerpts

v · Unicode			ISO/CEI 10646, Table des caractères Unicode, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, CESU-8, BOCU-1
Autres	ISO/CEI 2022, Big5, ISCII, GB 18030, GBK, Shift-JIS, Codage des caractères chinois

ISO/CEI 8859	ISO/CEI 8859-1 (latin-1), ISO/CEI 8859-3 (latin-3), ISO/CEI 8859-15 (latin-9)
Pages de code Windows	Windows-1252 (latin-1), Windows-1258 (vietnamien)
Pages de code MacOS	MacRoman
Pages de code DOS	CP437 (latin-US), CP850 (latin-1), CP852 (latin-2)
Pages de code diverses	DEC-MCS, KOI8-R (russe), KOI8-U (ukrainien), StandardEncoding (PostScript)
Non basés sur ISO 646	VISCII, EBCDIC, EBCDIC 297, EBCDIC 8859

Codés sur 7 bits	ASCII, ISO 646
Moins de 7 bits	Code morse, Code wabun, Code Baudot, RADIX-50, Sixbit

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Codage des caractères chinois

Voir aussi

Blocs de caractères Unicode pour l’écriture idéographique CJC

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link