- Table des caractères Unicode (0000-FFFF)
-
Tables Unicode (plan 0) 0000 – 0FFF 8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2FFF A000 – AFFF 3000 – 3FFF B000 – BFFF 4000 – 4FFF C000 – CFFF 5000 – 5FFF D000 – DFFF 6000 – 6FFF E000 – EFFF 7000 – 7FFF F000 – FFFF Autres plans Unicode 0000 – FFFF : plan 0 (BMP) 10000 – 1FFFF : plan 1 (SMP) 20000 – 2FFFF : plan 2 (SIP) 30000 – DFFFF : plans 3–13 (réservés) E0000 – EFFFF : plan 14 (SSP) F0000 – FFFFF : plan 15 (privé - A) 100000 – 10FFFF : plan 16 (privé - B) Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.
Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme U+xxxx (où xxxx est un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).
Plan multilingue de base (BMP)
Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.
Légende des conventions de couleurs et de style Les blocs affichés sur fond clair sont alloués et contiennent des caractères normalisés.
Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables.
Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères valides.
Les blocs affichés sur fond gris ne sont pas encore attribués officiellement (dans la version actuelle Unicode 6.0). Parmi ceux-ci :
- les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ;
- les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ;
- les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.
- Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens dans la première colonne des tables ci-dessous.
- Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.
Alphabets, abjads, abugidas et syllabaires modernes
Symboles et ponctuations d’usage général ou technique
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+2000 ponctuation générale exposants et indices symboles monétaires signes comb. p. symb. U+2100 symboles de type lettre formes numérales flèches U+2200 symboles mathématiques U+2300 signes techniques divers U+2400 pictogrammes de commande recon. optique alphanumériques cerclés U+2500 filets pavés formes géométriques U+2600 symboles divers U+2700 casseau div. symb. math.-A s. A fl. U+2800 combinaisons Braille U+2900 supplément B de flèches divers symboles mathématiques - B U+2A00 opérateurs mathématiques supplémentaires U+2B00 divers symboles et flèches Alphabets modernes - extension 1
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+2C00 glagolitique latin étendu C copte U+2D00 supplément géorgien tifinaghe éthiopien étendu cyrillique ét. A U+2E00 ponctuation complémentaire Idéogrammes, clés et traits les plus courants d’Asie orientale
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+2E00 formes supplémentaires des clés CJC U+2F00 clés chinoises kangxies — dsc. id. U+3000 symboles et ponct. CJC hiragana katakana U+3100 bopomofo jamos de compatibilité hangûl kanbn. bopomofo ét. traits CJC s. kana U+3200 lettres et mois CJC cerclés U+3300 compatibilité CJC U+3400
…
U+4000
…supplément A aux idéogrammes unifiés CJC U+4D00 hexagrammes du Yi Jing U+4E00
…
U+5000
…
U+6000
…
U+7000
…
U+8000
…
U+9000
…
U+9FFFidéogrammes unifiés CJC U+A000
…syllabaire yi des Monts frais U+A400 clés yi lisu Alphabets et alphasyllabaires modernes - extension 2
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+A500 vaï U+A600 cyrillique étendu B bamoum U+A700 l. modif. de ton latin étendu D U+A800 sylotî nâgrî n° Ind. phags-pa saurashtra dévanâgarî ét. U+A900 kayah li rejang jamos hangûl-A javanais (birman ét.-B) U+AA00 cham birman ét.-A taï việt (meitei. ét.) U+AB00 éthiopien étendu A meitei mayek U+AC00
…
U+B000
…
U+C000
…
U+D000
…hangûl U+D700 jamos hangûl étendus - B Points de codes à usage spécial
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+D800
...demi-zone haute d’indirection U+DB00 demi-zone haute d’indirection à usage privé U+DC00
...
U+DF00demi-zone basse d’indirection U+E000
...
U+F000
...
U+F800zone à usage privé Caractères de compatibilité, formes de présentation et autres caractères spéciaux
+00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0 U+F900
U+FA00idéogrammes de compatibilité CJC U+FB00 formes de prés. alphabétiques U+FC00 formes A de présentation arabes U+FD00 n.-c. f. A p.a. U+FE00 sél.var. vertic. ½-dia. f. comp. CJC petites formes formes B de présentation arabes U+FF00 formes de demi et pleine chasse sp. Voir aussi
Liens internes
- Unicode, ISO/CEI 10646
- UTF-8, UTF-16, UTF-32
- Aide:Caractères spéciaux
- Aide:Unicode
- Wikipédia:Unicode/Test
Liens externes
- Tables de caractères classées par écriture, sur le site officiel Unicode (dernière version normalisée) :
- (en) Roadmap to the BMP (Plane 0) (écritures supportées ou en cours de normalisation), sur le site officiel Unicode.
Catégorie :- Tables Unicode
Wikimedia Foundation. 2010.