Normalisation Unicode
- Normalisation Unicode
-
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
- Exemples
|
caractères |
|
forme
normalisée |
à |
a + ̀ |
= |
a + ̀ |
ẹ́ |
e + ́ + ̣ |
→ |
e + ̣ + ́ |
ñ |
ñ |
→ |
n + ̃ |
Ω (ohm) |
Ω |
→ |
Ω (omega) |
fi (ligature) |
fi |
= |
fi |
² |
² |
= |
² |
NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
- Exemples
|
caractères |
|
forme
normalisée |
à |
a + ̀ |
→ |
à |
ẹ́ |
e + ́ + ̣ |
→ |
ẹ + ́ |
ñ |
ñ |
→ |
ñ |
Ω (ohm) |
Ω |
→ |
Ω (omega) |
fi (ligature) |
fi |
= |
fi |
² |
² |
= |
² |
NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
- Exemples
|
caractères |
|
forme
normalisée |
à |
a + ̀ |
= |
a + ̀ |
ẹ́ |
e + ́ + ̣ |
→ |
e + ̣ + ́ |
ñ |
ñ |
→ |
n + ̃ |
Ω (ohm) |
Ω |
→ |
Ω (omega) |
fi (ligature) |
fi |
= |
f + i |
² |
² |
→ |
2 |
NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
- Exemples
|
caractères |
|
forme
normalisée |
à |
a + ̀ |
→ |
à |
ẹ́ |
e + ́ + ̣ |
→ |
ẹ + ́ |
ñ |
ñ |
= |
ñ |
Ω (ohm) |
Ω |
→ |
Ω (omega) |
fi (ligature) |
fi |
→ |
f + i |
² |
² |
→ |
2 |
Annexes
Articles connexes
Liens externes
Wikimedia Foundation.
2010.
Contenu soumis à la licence CC-BY-SA. Source : Article Normalisation Unicode de Wikipédia en français (auteurs)
Regardez d'autres dictionnaires:
Unicode — est une norme informatique, développée par le Consortium Unicode, qui vise à permettre le codage de texte écrit en donnant à tout caractère de n’importe quel système d’écriture un nom et un identifiant numérique, et ce de manière unifiée, quelle… … Wikipédia en Français
Equivalences unicode — Équivalences unicode Cet article traite des équivalences unicode. Unicode contient de nombreux caractères. Pour maintenir la compatibilité avec des standards existants, certains d’entre eux sont équivalents à d’autres caractères ou à des… … Wikipédia en Français
Équivalences unicode — Cet article traite des équivalences unicode. Unicode contient de nombreux caractères. Pour maintenir la compatibilité avec des standards existants, certains d’entre eux sont équivalents à d’autres caractères ou à des séquences de caractères.… … Wikipédia en Français
Table des caracteres Unicode (0000-FFFF) — Table des caractères Unicode (0000 FFFF) Tables Unicode 0000 – 0FFF 8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F … Wikipédia en Français
Table des caracteres Unicode (10000-1FFFF) — Table des caractères Unicode (10000 1FFFF) Tables Unicode 10000 – 10FFF 18000 – 18FFF 11000 – 11FFF 19000 – 19FFF … Wikipédia en Français
Table des caracteres Unicode (20000-2FFFF) — Table des caractères Unicode (20000 2FFFF) Tables Unicode 20000 – 20FFF 28000 – 28FFF 21000 – 21FFF 29000 – 29FFF … Wikipédia en Français
Table des caracteres Unicode (E0000-EFFFF) — Table des caractères Unicode (E0000 EFFFF) Tables Unicode E0000 – E0FFF E8000 – E8FFF E1000 – E1FFF E9000 – E9FFF … Wikipédia en Français
Table des caractères Unicode (10000-1FFFF) — Tables Unicode (plan 1) 10000 – 10FFF 18000 – 18FFF 11000 – 11FFF 19000 – 19FFF 12000 – 12FFF … Wikipédia en Français
Table des caractères Unicode (E0000-EFFFF) — Tables Unicode (plan E) E0000 – E0FFF E8000 – E8FFF E1000 – E1FFF E9000 – E9FFF E2000 – E2FFF … Wikipédia en Français
Table des caractères unicode (0000-ffff) — Tables Unicode 0000 – 0FFF 8000 – 8FFF 1000 – 1FFF 9000 – 9FFF 2000 – 2F … Wikipédia en Français