- Caractère (informatique)
-
Pour les articles homonymes, voir Caractère.
En informatique, le caractère est un type de données et une notion abstraite. Comme en typographie, un caractère informatique peut représenter une lettre minuscule, une lettre majuscule, un chiffre ou un signe de ponctuation, mais aussi une espace typographique, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.).
Comme les ordinateurs fonctionnent en binaire, chaque caractère reçoit un numéro, qui peut être codé sur un, deux, ou un nombre variable d'octets. Il existe plusieurs systèmes de codage de caractères dont, parmi les plus connus, ASCII, ISO 8859, et divers codages d'Unicode (UTF-8, UTF-16…). Ainsi dans les standards ASCII, ISO 8859, et Unicode, le caractère « A » a reçu le numéro 65, « B » le 66, « a » le 97 et « , » le 44. Le caractère « é » n'existe pas en ASCII, qui ne contient que 128 caractères. En revanche, « é » a le numéro 233 en ISO 8859-1 et Unicode. Le caractère « € » n'existe pas en ISO 8859-1. En revanche en Unicode, « € » a le numéro 8364. Ce dernier numéro ne peut pas être codé sur un seul octet car il faut 14 bits pour représenter 8364 en base 2 (10000010101100).
Les caractères informatiques permettent de directement représenter un texte brut, avec les espaces et les retours à la ligne, mais sans formatage plus élaboré (type de fonte de caractères, couleur, taille des caractères, etc.). Les caractères spéciaux étaient surtout utilisés par le matériel informatique (terminaux et imprimantes) d'avant les années 1990 qui ne fonctionnait qu'en mode texte.
L'affichage d'un caractère sur un écran ou son impression avec une imprimante nécessite les données spécifiant le dessin exact du caractère, le glyphe. Comme en typographie, un ensemble de glyphes d'une même famille de caractères est une police de caractères.
Très souvent les ordinateurs traitent des mots, des phrases, des paragraphes entiers. Il existe un type de données pour représenter une suite de caractères, c'est la chaîne de caractères.
Voir aussi
Wikimedia Foundation. 2010.