Big5

Big5: Big5 ou Big-5 est une méthode de codage de caractères, principalement utilisée à Taïwan et à Hong Kong, permettant de saisir les caractères chinois traditionnels. Son équivalent pour les caractères chinois simplifiés est le codage GB, utilisé en République populaire de Chine.

Sommaire

1 Nom

2 Histoire

3 Structure

3.1 Principes

3.2 Quelques détails

4 Voir aussi

Nom

Le nom chinois Big5 五大碼 (pinyin : wǔdàmǎ) signifie « Codage des Cinq Grands ». Ce nom fait référence au but originel de supporter les cinq principaux paquetages utilisés à Taïwan à cette époque, ou aux cinq principales compagnies informatiques à Taïwan : 宏碁 (Acer), 神通 (MiTAC), 佳佳, 零壹 (Zero One) et 大眾 (FIC), qui ont collaboré à l'élaboration de ce code.

Histoire

La méthode d'encodage Big5 a été défini par l'Institut de l’Information Industrielle de Taïwan (財團法人資訊工業策進會) en 1984. D'après certaines sources, le codage Big5 fut popularisé par son adoption dans différents paquetages commerciaux, et tout particulièrement, par le système chinois ET qui fonctionnait sous MS-DOS.

Le gouvernement de la République de Chine le déclare comme son standard au milieu des années 1980 alors que Big5 était déjà un standard de fait.

Hong Kong a aussi adopté le codage de caractères Big5. Cependant, le cantonais, langue officielle de cette région, utilise beaucoup de caractères chinois archaïques qui ne sont pas disponibles dans ce jeu de caractères. Pour régler ce problème, le gouvernement de Hong Kong créa l'extension « Government Chinese Character Set » en 1995 puis « Hong Kong Supplementary Character Set » (HKSCS) en 1999. Les extensions de Hong Kong sont distribuées habituellement sous forme de patch.

Structure

Principes

La table de caractères originale Big5 est classée premièrement par la fréquence d'usage, puis par le nombre de traits et enfin par les radicaux Kangxi.

Dans ce premier jeu de caractères, il y manquait des sinogrammes pourtant fréquemment utilisés. C'est pourquoi, chaque fournisseur développa sa propre extension. Ainsi, l'extension ETen devint partie intégrante du standard Big5 actuel grâce à sa popularité.

La structure du codage Big5 n'était pas conforme au standard ISO 2022 mais possédait certaines similarités avec le codage Shift_JIS : il s'agit d'un codage à double-octets ayant la structure suivante :

le premier octet s'étend dans la plage 0xa1-0xfe

le second octet s'étend dans les plages 0x40-0x7e et 0xa1-0xfe

Certaines variantes du Big5, comme le HKSCS, utilisent une plage étendue pour le premier octet, correspondant aux valeurs situées entre 0x80 et 0xA0 (comme pour le Shift_JIS).

La valeur de chaque code Big5 est le plus souvent représenté par un nombre hexadécimal à 4 chiffres, qui décrit les deux octets du code Big5 de la même manière que la représentation big-endian (ou gros-boutiste). Par exemple, le code Big5 du caractère "五", dont les octets lui correspondant sont 0xa4 0xad, est écrit A4AD.

En théorie, le codage Big5 paraît être exclusivement à double-octets. Dans la pratique, les codes Big5 sont toujours employés avec le codage ASCII (ou autres jeux de caractères en 8 bits). Vous pourrez donc trouver un mélange de codes Big5 et ASCII dans un texte encodé en Big5. Les octets appartenant à la plage 0x00-0x7f, qui ne se retrouvent par dans les codages en double-octets, seront considérés comme étant ASCII.

Quelques détails

Dans le Big5 originel, la table de code était séparé en plusieurs parties :

A140-A3BF "Caractères graphiques"* (圖形碼)

A3C0-A3FE Plage réservée aux caractères définis par l'utilisateur (造字)

A440-C67E Caractères chinois fréquents (常用字)

C6A1-C8FE Plage réservée aux caractères définis par l'utilisateur (造字)

C940-F9D5 Caractères chinois moins fréquents (次常用字)

F9D6-FEFE Plage réservée aux caractères définis par l'utilisateur (造字)

* Les "caractères graphiques" comprennent en fait les signes de ponctuation, les symboles, les caractères étrangers et autres caractères spéciaux.

Dans la plupart des extensions, les caractères ajoutés se trouvaient dans les plages réservées correspondant à la zone précédente : les ponctuations additionnelles étaient mises dans la plage réservée A3C0-A3FE, les caractères additionnels dans la plage C6A1-C8FE ou F9D6-FEFE. Parfois, en raison du nombre trop important de caractères ajoutés, certains groupes n'ont pas pu respecter cette règle comme les lettres cyrilliques et les kana qui se sont retrouvés dans la plage C6A1-C8FE.

Voir aussi

Unicode

Codage des caractères chinois

v · Unicode
ISO/CEI 10646, Table des caractères Unicode, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, CESU-8, BOCU-1

Autres ISO/CEI 2022, Big5, ISCII, GB 18030, GBK, Shift-JIS, Codage des caractères chinois

Codés sur 8 bits

ISO/CEI 8859 ISO/CEI 8859-1 (latin-1), ISO/CEI 8859-3 (latin-3), ISO/CEI 8859-15 (latin-9)

Pages de code Windows Windows-1252 (latin-1), Windows-1258 (vietnamien)

Pages de code MacOS MacRoman

Pages de code DOS CP437 (latin-US), CP850 (latin-1), CP852 (latin-2)

Pages de code diverses DEC-MCS, KOI8-R (russe), KOI8-U (ukrainien), StandardEncoding (PostScript)

Non basés sur ISO 646 VISCII, EBCDIC, EBCDIC 297, EBCDIC 8859

Autres

Codés sur 7 bits ASCII, ISO 646

Moins de 7 bits Code morse, Code wabun, Code Baudot, RADIX-50, Sixbit

Articles connexes Codage des caractères, Clavier d’ordinateur, Police numérique, Glyphe, Portail:Écriture

Portail de l’informatique

Portail de l’écriture

Portail de Hong Kong

Portail de Macao

Catégories :
Codage du texte
Hong Kong
République de Chine
Macao

Contenu soumis à la licence CC-BY-SA. Source : Article Big5 de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

Big5 — ist eine Zeichenkodierung für traditionelle chinesische Schriftzeichen. Sie kodiert 13.062 chinesische Schriftzeichen (zwei Schriftzeichen sind allerdings doppelt kodiert) und ist bei weitem der am meisten benutzte Zeichensatz in der Republik… … Deutsch Wikipedia
Big5 — Saltar a navegación, búsqueda Big 5 o Big5 es un código de caracteres usado en Taiwán, Hong Kong y Macao para ideogramas tradicionales. Su equivalente en China continental es GB. Organización El juego de caracteres original Big5 estaba ordenado… … Wikipedia Español
Big5 — Big 5 or Big5 is a character encoding method used in Taiwan, Hong Kong and Macau for Traditional Chinese characters. Its Mainland China equivalent is GB. Organization The original Big5 character set is sorted first by usage frequency, second by… … Wikipedia
Big5 — noun /bɪɡ faɪv/ A character encoding method for Traditional Chinese characters defined by collaboration among 5 major computer companies in Taiwan … Wiktionary
BIG5 — Chinese text (old version) (Computing » File Extensions) … Abbreviations dictionary
Big-5 — Big5 Big5 ou Big 5 est une méthode de codage de caractères, principalement utilisée à Taïwan et à Hong Kong, permettant de saisir les caractères chinois traditionnels. Son équivalent pour les caractères chinois simplifiés est le codage GB,… … Wikipédia en Français
Codepage 950 — Big5 ist eine Zeichenkodierung für traditionelle chinesische Schriftzeichen. Sie kodiert 13.062 chinesische Schriftzeichen (zwei Schriftzeichen sind allerdings doppelt kodiert) und ist bei weitem der am meisten benutzte Zeichensatz in der… … Deutsch Wikipedia
Xinhai Revolution — (Revolution of 1911) Xinhai Revolution in Shanghai; The picture above is Nanking Road after the Shanghai Uprising, hung with the Five Races Under One U … Wikipedia
S.H.E — Infobox Chinese language singer and actor name = S.H.E caption = Hebe, Ella, and Selina (from left to right) in Hong Kong during their Perfect 3 tour. othername = 女朋友 (CJKV|p=nǚ péngyŏu|l=Girl Friends) occupation = Singers, actresses genre =… … Wikipedia
Lee Young Ae — Infobox actor name = Lee Young Ae caption = On boat ride in Thousand Island Lake of China to Lee Young Ae Elementary School, 2006 3 18. birthdate = Birth date and age|1971|1|31|mf=y birthplace = Seoul, South Korea occupation = Actress website =… … Wikipedia

Dictionnaires et Encyclopédies sur 'Academic'

Big5

Sommaire

Nom

Histoire

Structure

Principes

Quelques détails

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

A140-A3BF	"Caractères graphiques"* (圖形碼)
A3C0-A3FE	Plage réservée aux caractères définis par l'utilisateur (造字)
A440-C67E	Caractères chinois fréquents (常用字)
C6A1-C8FE	Plage réservée aux caractères définis par l'utilisateur (造字)
C940-F9D5	Caractères chinois moins fréquents (次常用字)
F9D6-FEFE	Plage réservée aux caractères définis par l'utilisateur (造字)

v · Unicode			ISO/CEI 10646, Table des caractères Unicode, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, CESU-8, BOCU-1
Autres	ISO/CEI 2022, Big5, ISCII, GB 18030, GBK, Shift-JIS, Codage des caractères chinois

ISO/CEI 8859	ISO/CEI 8859-1 (latin-1), ISO/CEI 8859-3 (latin-3), ISO/CEI 8859-15 (latin-9)
Pages de code Windows	Windows-1252 (latin-1), Windows-1258 (vietnamien)
Pages de code MacOS	MacRoman
Pages de code DOS	CP437 (latin-US), CP850 (latin-1), CP852 (latin-2)
Pages de code diverses	DEC-MCS, KOI8-R (russe), KOI8-U (ukrainien), StandardEncoding (PostScript)
Non basés sur ISO 646	VISCII, EBCDIC, EBCDIC 297, EBCDIC 8859

Codés sur 7 bits	ASCII, ISO 646
Moins de 7 bits	Code morse, Code wabun, Code Baudot, RADIX-50, Sixbit

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Big5

Sommaire

Nom

Histoire

Structure

Principes

Quelques détails

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link