Entité de caractère

Entité de caractère

Une entité de caractère, ou référence de caractère, est un code SGML qui référence un caractère de la norme UCS. Elle permet d'afficher des caractères indépendamment du jeu du document.

On utilise généralement des entités dans les documents HTML et xHTML (car XML est basé sur SGML).

Sommaire

Références numériques

Afin de contourner les limitations des encodages, SGML est conçu de telle manière qu'il est possible de représenter les caractères de l'intégralité d'Unicode à l'intérieur d'un document HTML en utilisant une référence de caractère numérique : une séquence de caractères qui épelle explicitement le numéro du point de code Unicode du caractère à représenter. Une référence numérique prend la forme

&#N;,

N est soit un nombre décimal, soit un nombre hexadécimal, auquel cas il est préfixé par x. Les caractères autorisés pour être référencés par un nombre sont tous les caractères universellement représentables dans chaque encodage approuvé pour une utilisation sur Internet.[réf. nécessaire]

Par exemple, un point de code Unicode comme 9835, qui correspond à deux croches liées, doit être précédé par & et suivi de ;, comme cela : ♫, ce qui produit ceci : ♫.

Le support d'hexadécimaux dans ce contexte est plus récent ; par conséquent les navigateurs web plus anciens peuvent avoir des problèmes pour afficher les caractères référencés avec des nombres hexadécimaux – mais de toute façon, ils auront aussi des problèmes pour afficher des caractères Unicode dont le point de code est supérieur à 255. Pour assurer une meilleure compatibilité avec des navigateurs plus anciens, il est commun de convertir les points de code hexadécimaux en valeurs décimales (par exemple ♫ au lieu de ♫).

Références nommées (entités de caractères)

En SGML, il existe un jeu standard de 252 entités de caractère nommées pour des caractères qui sont soit absents de certains encodages, soit sensibles au balisage dans certains contextes (par exemple les chevrons et esperluettes). Bien que n'importe quel caractère Unicode puisse être référencé par la valeur numérique de son point de code, certains auteurs de documents HTML préfèrent utiliser ces entités nommées à la place, si possible, car elles sont plus intuitives, notamment pour les anglophones, et étaient mieux supportées sur les navigateurs plus anciens.

Une entité de caractère prend la forme

&EntityName;,

EntityName est le nom de l'entité. Par exemple, – se réfère à – ou – et représente U+2013, le tiret demi-cadratin – comme ceci.

Voir aussi

Articles connexes

Liens externes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Entité de caractère de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Entite de caractere — Entité de caractère Une entité de caractère, ou référence de caractère, est un code SGML qui référence un caractère de la norme UCS. Elle permet d afficher des caractères indépendamment du jeu du document. On utilise généralement des entités dans …   Wikipédia en Français

  • Entité De Caractère — Une entité de caractère, ou référence de caractère, est un code SGML qui référence un caractère de la norme UCS. Elle permet d afficher des caractères indépendamment du jeu du document. On utilise généralement des entités dans les documents HTML… …   Wikipédia en Français

  • Entité HTML — Entité de caractère Une entité de caractère, ou référence de caractère, est un code SGML qui référence un caractère de la norme UCS. Elle permet d afficher des caractères indépendamment du jeu du document. On utilise généralement des entités dans …   Wikipédia en Français

  • Entité — Sur les autres projets Wikimedia : « Entité », sur le Wiktionnaire (dictionnaire universel) L entité est un ensemble de moyens traduisant le réseau de relations de dépendance ; celles ci pouvant être sous tendues par un lien… …   Wikipédia en Français

  • Esperluette — Pour les articles homonymes, voir Éperluette. v · d · …   Wikipédia en Français

  • Coupure de mot — Pour les articles homonymes, voir césure. En typographie et en orthographe, la coupure de mot, parfois appelée aussi césure, est l opération qui consiste à couper en fin de ligne un mot qui n’entrerait pas dans la justification. Cette… …   Wikipédia en Français

  • acidité — [ asidite ] n. f. • 1545; bas lat. aciditas 1 ♦ Saveur acide. L acidité du citron, de l oseille. ♢ Fig. Caractère mordant, causticité. L acidité de sa remarque. Caractère piquant. « Cette acidité virginale » (Tharaud). 2 ♦ Chim. Qualité acide d… …   Encyclopédie Universelle

  • & — Esperluette Pour les articles homonymes, voir Éperluette. Ponctuation Accolades ( { } ) · Parenthèses ( ( ) )  Chevrons ( < > ) · …   Wikipédia en Français

  • Césure (typographie) — Coupure de mot Pour les articles homonymes, voir césure. En typographie, la coupure de mot (parfois aussi appelée césure) est l opération qui consiste à couper en fin de ligne un mot qui n entrerait pas dans la justification. Cette… …   Wikipédia en Français

  • Eperluette — Esperluette Pour les articles homonymes, voir Éperluette. Ponctuation Accolades ( { } ) · Parenthèses ( ( ) )  Chevrons ( < > ) · …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”