Plan Multilingue de Base

Plan Multilingue de Base

Table des caractères Unicode (0000-FFFF)

Tables Unicode
0000 – 0FFF   8000 – 8FFF
1000 – 1FFF 9000 – 9FFF
2000 – 2FFF A000 – AFFF
3000 – 3FFF B000 – BFFF
4000 – 4FFF C000 – CFFF
5000 – 5FFF D000 – DFFF
6000 – 6FFF E000 – EFFF
7000 – 7FFF F000 – FFFF
Autres plans Unicode
0000 – 0FFF   plan BMP
10000 – 10FFF plan SMP
20000 – 20FFF plan SIP
30000 – D0FFF plans réservés
E0000 – E0FFF plan SSP
F0000 – F0FFF plan privé - A
100000 – 100FFF plan privé - B

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme U+xxxx (où xxxx est un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).

Sommaire

Plan multilingue de base (BMP)

Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.

Légende des conventions de couleurs et de style

Les blocs affichés sur fond clair sont alloués et contiennent des caractères normalisés.

Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non intéropérables.

Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères valides.

Les blocs affichés sur fond gris ne sont pas encore attribués officiellement (dans la version actuelle Unicode 5.0). Parmi ceux-ci :

  • les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ;
  • les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ;
  • les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.
  • Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens la première colonne des tables ci-dessous.
  • Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.

Alphabets, abjads, abugidas et syllabaires modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+0000 commandes C0 latin basique commandes C1 supplément latin-1
U+0100 latin étendu-A latin étendu-B
U+0200 latin étendu-B alphabet phonétique international lettres modificatives avec chasse
U+0300 diacritiques grec et copte
U+0400 cyrillique
U+0500 suppl. cyrillique arménien hébreu
U+0600 arabe
U+0700 syriaque suppl. arabe thâna n’ko
U+0800 (samaritain) (mandaïque) (arab. pédag.) ¿arabe étendu-A?
U+0900 devanâgarî bengalî
U+0A00 gourmoukhî goudjarâtî
U+0B00 oriyâ tamoul
U+0C00 télougou kannara
U+0D00 malayalam singhalais
U+0E00 thaï laotien
U+0F00 tibétain
U+1000 birman géorgien
U+1100 jamos hangûls
U+1200 éthiopien
U+1300 éthiopien suppl. éthiopien tchérokî
U+1400
U+1500
syllabaire aborigène canadien unifié
U+1600 syllabaire aborigène canadien unifié ogam runique
U+1700 tagalog hanounóo bouhide tagbanoua khmer
U+1800 mongol (syllab. canadien étendu-A)
U+1900 limbou taï-le nouveau taï-lü symb. khmers
U+1A00 bouguis (taï-tham) ¿pahawh hmong?
U+1B00 balinais sundanais (batak)
U+1C00 lepcha ol tchiki (ext. védiques)
U+1D00 extensions phonétiques suppl. ext. phonétiques suppl. diacritiques
U+1E00 latin étendu additionel
U+1F00 grec étendu

Symboles et ponctuations d’usage général ou technique

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2000 ponctuation générale exposants et indices symboles monétaires diacritiques p. symb.
U+2100 symboles lettrés formes numérales flèches
U+2200 symboles mathématiques
U+2300 divers techniques
U+2400 pictogrammes de contrôle recon. optique alphanumériques entourés
U+2500 filets pavés formes géométriques
U+2600 symboles divers
U+2700 casseau symb. math. div.-A s. flèc.-A
U+2800 motifs Braille
U+2900 supplément de flèches-B symboles mathématiques div.-B
U+2A00 supplément d’opérateurs mathématiques
U+2B00 symboles et flèches divers

Alphabets modernes - extension 1

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2C00 glagolitique latin étendu C copte
U+2D00 géorgien suppl. tifinagh éthiopien étendu
U+2E00 ponctuation supplémentaire  

Idéogrammes, clés et traits les plus courants d’Asie orientale

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2E00   supplément de clés CJC
U+2F00 clés kangxies dsc. id.
U+3000 symboles et ponct. CJC hiragana katakana
U+3100 bopomofo jamos compatibilité hangûl kanbn. bopomofo ét. traits CJC ext.kana
U+3200 lettres et mois CJC entourés
U+3300 compatibilité CJC
U+3400
...
U+4000
...
idéographes unifiés CJC - extension A
U+4D00 idéographes unifiés CJC - extension A hexagrammes Yi Jing
U+4E00
...
U+5000
...
U+6000
...
U+7000
...
U+8000
...
U+9000
...
idéographes unifiés CJC
U+9F00 idéographes unifiés CJC
U+A000
...
syllabaire yi des Monts frais
U+A400 syllabaire yi des Monts frais clés yies (lisu)

Alphabets et alphasyllabaires modernes - extension 2

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+A500 vaï
U+A600 vaï cyrillique étendu-B (bamoum)
U+A700 modif. tons latin étendu D
U+A800 sylotî nâgrî (n°Ind.) ’phags pa saurashtra (déva.ét.)
U+A900 kayah li rejang (hangul-A) (javanais) (s.can.ét-A)
U+AA00 cham (mymr.ét.-A) (việt thái) (mtei.ét.)
U+AB00 (varang kshitî) (sorang sompeng) ¿béria? (meetei mayek)
U+AC00
...
U+B000
...
U+C000
...
U+D000
...
syllabes hangûles
U+D700 syllabes hangûles (jamos hangûls extension-B)

Points de codes à usage spécial

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+D800
...
demi-zone haute d’indirection
U+DB00 demi-zone haute d’indirection demi-zone haute d’indirection à usage privé
U+DC00
...
U+DF00
demi-zone basse d’indirection
U+E000
...
U+F000
...
U+F800
zone à usage privé

Caractères de compatibilité, formes de présentation et autres caractères spéciaux

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+F900
U+FA00
idéographes de compatibilité CJC
U+FB00 formes de prés. alphabétiques formes de présentation arabes A
U+FC00 formes de présentation arabes A
U+FD00 formes de présentation arabes A sp. f.p.a.A
U+FE00 sél.var. vertic. ½-dia. f. comp. CJC petites formes formes de présentation arabes B
U+FF00 formes de demie ou pleine chasse sp.

Voir aussi

Liens internes

Liens externes

  • Portail de l’informatique Portail de l’informatique
  • Portail de l’écriture Portail de l’écriture
Ce document provient de « Table des caract%C3%A8res Unicode (0000-FFFF) ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Plan Multilingue de Base de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

  • Version Multilingue — Doublage Pour les articles homonymes, voir Doublage (homonymie). Le doublage est une technique consistant à substituer aux voix des comédiens d une œuvre audiovisuelle (film, feuilleton...), les voix de comédiens s exprimant dans une autre langue …   Wikipédia en Français

  • Point de code — Unicode Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Unicode — est une norme informatique, développée par le Consortium Unicode, qui vise à permettre le codage de texte écrit en donnant à tout caractère de n’importe quel système d’écriture un nom et un identifiant numérique, et ce de manière unifiée, quelle… …   Wikipédia en Français

  • Table des caracteres Unicode — Table des caractères Unicode Tables Unicode 0000 – 0FFF   8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F …   Wikipédia en Français

  • Table des caractères Unicode — Tables Unicode (plan 0) 0000 – 0FFF   8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2FFF …   Wikipédia en Français

  • Table des caractères unicode — Tables Unicode 0000 – 0FFF   8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F …   Wikipédia en Français

  • ISO/CEI 10646 — La norme ISO/CEI 10646, intitulée Technologies de l information Jeu universel de caractères codés (JUC), tente de définir un système de codage universel pour tous les systèmes d’écriture. Cette norme est le fondement d’Unicode. Sommaire 1… …   Wikipédia en Français

  • ISO 10646 — ISO/CEI 10646 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Iso/cei 10646 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • UCS — ISO/CEI 10646 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”