- Final Draft for International Standard
-
ISO 639
L’ISO 639 (ICS n°01.140.20) est une norme internationale l'ISO qui définit des codes pour la représentation des noms de langues.
Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple
fi
etfin
sont associés au finnois. Le standard est composé actuellement de trois parties, dont la publication s'est déroulée de 1998 à 2007, et trois autres parties sont encore en projet.La norme se compose de différentes parties :
- ISO 639-1 (2002) : Codes pour la représentation des noms de langues - Partie 1 : Codes alpha-2 (liste des codes ISO 639-1)
- ISO 639-2 (1998) : Codes pour la représentation des noms de langues - Partie 2 : Codes alpha-3 (liste des codes ISO 639-2)
- ISO 639-3 (2007) : Codes pour la représentation des noms de langues - Partie 3 : Codes alpha-3 pour un traitement exhaustif des langues
- ISO/CD 639-4 (2009?) : Codes pour la représentation des noms de langues -- Partie 4 : Lignes directrices pour la mise en oeuvre et principes généraux des codes de langues
- ISO 639-5 (2008) : Codes pour la représentation des noms de langues - Partie 5 : Code alpha-3 pour les familles de langues et groupes de langues
- ISO/CD 639-6 (2009?) : Codes pour la représentation des noms de langues - Partie 6 : Représentation alpha-4 pour un traitement exhaustif des variantes linguistiques
Sommaire
Codes alpha-2
Les codes à 2 caractères latins, utilisé par l'ISO 639-1, donnent la possibilité de coder 262=676 langues différentes. Ceci est insuffisant pour coder l'ensemble des langues (estimé de 4000 à 7000), ce qui est réalisé par les normes ISO 639-2 et ISO 639-3 qui utilisent des codes à 3 lettres. La norme ISO 639-1 associe chaque code au nom de la langue en français et en anglais.
Codes alpha-3
Les codes à 3 caractères latins donnent la possibilité de coder 263=17 576 langues différentes. Les codes à 3 lettres sont utilisés par l'ISO 639-2 et l'ISO 639-3.
L'ISO 639-2 définit en plus de l'ISO 639-1 des codes désignant des groupes de langues (arabe, quechua, chinois…), ainsi que des codes spéciaux :
mis
utilisé pour une langue identifiée mais qui ne dispose ou ne disposait pas encore de codes alpha-2 ou alpha-3 (ce code étant complété souvent d’extensions codifiées pour l’écriture utilisée et l’emplacement géographique, ou non codifiées pour les variantes linguistiques),mul
pour codifier les contenus multilingues, c'est-à-dire quand il n’est pas possible d’étiqueter ses éléments séparément et que ceux-ci utilisent des langues différentes, et que la liste des langues ne peut être spécifiée pour le contenu tout entier,und
pour codifier toute langue inconnue ou non complètement identifiable,zxx
pour coder l'absence de tout contenu linguistique ou attribuable à une langue ou groupe de langue particulier (par exemple une photo de la Lune, un fond musical, etc.),- et enfin
qaa-qtz
, un espace de 520 autres codes réservés mais laissés à un usage privé hors du champ de la normalisation.
Certaines langues (23 en tout) sont codées dans l'ISO 639-2 par deux codes différents : terminologique et bibliographique. Par exemple pour l'allemand, on a :
ger
pour le code bibliographique (conservé pour des raisons de compatibilité historique avec les systèmes d’échanges et de classification d’information bibliographiques normalisés dans certains pays) etdeu
pour le code terminologique (à utiliser dans tous les autres cas, y compris pour l’usage selon la norme technique RFC 4646 / BCP 47) ; de même le code alpha-3 bibliographique pour le français estfre
mais le code alpha-3 terminologique estfra
.L'ISO 639-3, publié en 2007, vise à répertorier le plus grand nombre possible de langues. Celles-ci peuvent être d'une part des langues individuelles (exemple : arménien,
hye
), des macrolangues (exemple : albanais,sqi
) ou des collections de langues (exemple : langues algonquiennes,alg
) ; et d'autre part des langues vivantes (exemple : irlandais,gle
), éteintes (récemment, par exemple kato,ktw
), anciennes (disparues il y a longtemps, par exemple : vieux norrois,non
), historiques (distinctes de langues modernes, mais dont ces dernières descendent de la langue considérée, par exemple moyen anglais,enm
) ou construites (exemple : klingon,tlh
).SIL International est l'auteur principal de l'ISO 639-3 et s’est largement appuyé sur les données en provenance de la base de données Ethnologue.com pour codifier des centaines de langues auparavant non codées. Toutefois les codes Ethnologues.com (trois caractères indiqués en majuscules jusque dans sa 15e édition) n'ont pas été tous retenus car certains étaient en conflits avec des codes ISO 639-2 existants. Depuis la publication de la norme ISO 639-3, Ethnologue.com a modifié sa base de données et n’utilise plus que les codes ISO 639-3 (en minuscules) : ses anciens codes, auparavant utilisés aussi par SIL, ne doivent plus être utilisés car Ethnologue.com ne les supporte plus. La norme ISO 639-3 a subi de nombreuses modifications et corrections depuis sa première publication (et notamment de nombreux codes publiés transitoirement dans la version bêta ont été supprimés, fusionnés ou scindés suite aux contributions et discussions sur cette nouvelle norme).
L’ISO 639-5, dont une première version provisoire a été publiée le 15 mai 2008, vise à classer l’ensemble des langues individuelles (ou éventuelles macro-langues qui les contiennent) en familles de langues et groupes de langues selon un système plus complet que ce que permet l’ISO 639-3 (qui ne traite que des macro-langues sans possibilité de définir une hiérarchie complète sur plus d'un seul niveau), en attribuant des codes alpha-3 supplémentaires pour ces familles et groupes de langues, ce que ne permet pas l’ISO 639-1 ou 639-2, où des codes collectifs ont été définis (mais non spécifiés précisément) regroupant parfois des langues isolées de différents groupes et non mutuellement intelligibles ou des groupes trop restreints de langues.
La nouvelle norme ISO 639-5 (publiée mais pas encore sous une forme librement diffusable) visera à préciser les codes collectifs de ISO 639-2 (ou leur équivalent dans la norme ISO 639-1 quand ils existent ; il n'y a aucun nouveau code collectif dans la norme ISO 639-3) et à en définir d’autres selon une classification scientifique la plus sérieuse possible, et les avis des linguistes et bibliothèques du monde entier (elle s’appuie largement sur les données de classification des langues déjà collectées et publiées par Ethnologue.com). Cette norme visera aussi à faciliter la localisation des logiciels et améliorer globalement le traitement des langues plus rares en les rapprochant de langues plus proches au lieu d’utiliser une langue de repli unique (souvent l’anglais dans une version simplifiée et parfois imprécise).
Voir aussi
Articles connexes
- Liste des codes ISO 639-1
- Liste des codes ISO 639-2
- ISO 3166 (codes de noms de pays)
- ISO 15924 (codes de systèmes d'écriture)
Liens externes
- Site officiel de l'ISO 639-2
- Site officiel de SIL sur ISO 639-3
- Les codes et noms de langues ISO 639 dans plusieurs langues
- Portail des langues
Catégories : ISO 639 | Langue | Norme ISO | Identifiant
Wikimedia Foundation. 2010.