ISO 639-1

ISO 639-1

ISO 639

L’ISO 639 (ICS n°01.140.20) est une norme internationale l'ISO qui définit des codes pour la représentation des noms de langues.

Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple fi et fin sont associés au finnois. Le standard est composé actuellement de trois parties, dont la publication s'est déroulée de 1998 à 2007, et trois autres parties sont encore en projet.

La norme se compose de différentes parties :

  • ISO 639-1 (2002) : Codes pour la représentation des noms de langues - Partie 1 : Codes alpha-2 (liste des codes ISO 639-1)
  • ISO 639-2 (1998) : Codes pour la représentation des noms de langues - Partie 2 : Codes alpha-3 (liste des codes ISO 639-2)
  • ISO 639-3 (2007) : Codes pour la représentation des noms de langues - Partie 3 : Codes alpha-3 pour un traitement exhaustif des langues
  • ISO/CD 639-4 (2009?) : Codes pour la représentation des noms de langues -- Partie 4 : Lignes directrices pour la mise en oeuvre et principes généraux des codes de langues
  • ISO 639-5 (2008) : Codes pour la représentation des noms de langues - Partie 5 : Code alpha-3 pour les familles de langues et groupes de langues
  • ISO/CD 639-6 (2009?) : Codes pour la représentation des noms de langues - Partie 6 : Représentation alpha-4 pour un traitement exhaustif des variantes linguistiques

Sommaire

Codes alpha-2

Les codes à 2 caractères latins, utilisé par l'ISO 639-1, donnent la possibilité de coder 262=676 langues différentes. Ceci est insuffisant pour coder l'ensemble des langues (estimé de 4000 à 7000), ce qui est réalisé par les normes ISO 639-2 et ISO 639-3 qui utilisent des codes à 3 lettres. La norme ISO 639-1 associe chaque code au nom de la langue en français et en anglais.

Codes alpha-3

Les codes à 3 caractères latins donnent la possibilité de coder 263=17 576 langues différentes. Les codes à 3 lettres sont utilisés par l'ISO 639-2 et l'ISO 639-3.

L'ISO 639-2 définit en plus de l'ISO 639-1 des codes désignant des groupes de langues (arabe, quechua, chinois…), ainsi que des codes spéciaux :

  • mis utilisé pour une langue identifiée mais qui ne dispose ou ne disposait pas encore de codes alpha-2 ou alpha-3 (ce code étant complété souvent d’extensions codifiées pour l’écriture utilisée et l’emplacement géographique, ou non codifiées pour les variantes linguistiques),
  • mul pour codifier les contenus multilingues, c'est-à-dire quand il n’est pas possible d’étiqueter ses éléments séparément et que ceux-ci utilisent des langues différentes, et que la liste des langues ne peut être spécifiée pour le contenu tout entier,
  • und pour codifier toute langue inconnue ou non complètement identifiable,
  • zxx pour coder l'absence de tout contenu linguistique ou attribuable à une langue ou groupe de langue particulier (par exemple une photo de la Lune, un fond musical, etc.),
  • et enfin qaa-qtz, un espace de 520 autres codes réservés mais laissés à un usage privé hors du champ de la normalisation.

Certaines langues (23 en tout) sont codées dans l'ISO 639-2 par deux codes différents : terminologique et bibliographique. Par exemple pour l'allemand, on a : ger pour le code bibliographique (conservé pour des raisons de compatibilité historique avec les systèmes d’échanges et de classification d’information bibliographiques normalisés dans certains pays) et deu pour le code terminologique (à utiliser dans tous les autres cas, y compris pour l’usage selon la norme technique RFC 4646 / BCP 47) ; de même le code alpha-3 bibliographique pour le français est fre mais le code alpha-3 terminologique est fra.

L'ISO 639-3, publié en 2007, vise à répertorier le plus grand nombre possible de langues. Celles-ci peuvent être d'une part des langues individuelles (exemple : arménien, hye), des macrolangues (exemple : albanais, sqi) ou des collections de langues (exemple : langues algonquiennes, alg) ; et d'autre part des langues vivantes (exemple : irlandais, gle), éteintes (récemment, par exemple kato, ktw), anciennes (disparues il y a longtemps, par exemple : vieux norrois, non), historiques (distinctes de langues modernes, mais dont ces dernières descendent de la langue considérée, par exemple moyen anglais, enm) ou construites (exemple : klingon, tlh).

SIL International est l'auteur principal de l'ISO 639-3 et s’est largement appuyé sur les données en provenance de la base de données Ethnologue.com pour codifier des centaines de langues auparavant non codées. Toutefois les codes Ethnologues.com (trois caractères indiqués en majuscules jusque dans sa 15e édition) n'ont pas été tous retenus car certains étaient en conflits avec des codes ISO 639-2 existants. Depuis la publication de la norme ISO 639-3, Ethnologue.com a modifié sa base de données et n’utilise plus que les codes ISO 639-3 (en minuscules) : ses anciens codes, auparavant utilisés aussi par SIL, ne doivent plus être utilisés car Ethnologue.com ne les supporte plus. La norme ISO 639-3 a subi de nombreuses modifications et corrections depuis sa première publication (et notamment de nombreux codes publiés transitoirement dans la version bêta ont été supprimés, fusionnés ou scindés suite aux contributions et discussions sur cette nouvelle norme).

L’ISO 639-5, dont une première version provisoire a été publiée le 15 mai 2008, vise à classer l’ensemble des langues individuelles (ou éventuelles macro-langues qui les contiennent) en familles de langues et groupes de langues selon un système plus complet que ce que permet l’ISO 639-3 (qui ne traite que des macro-langues sans possibilité de définir une hiérarchie complète sur plus d'un seul niveau), en attribuant des codes alpha-3 supplémentaires pour ces familles et groupes de langues, ce que ne permet pas l’ISO 639-1 ou 639-2, où des codes collectifs ont été définis (mais non spécifiés précisément) regroupant parfois des langues isolées de différents groupes et non mutuellement intelligibles ou des groupes trop restreints de langues.

La nouvelle norme ISO 639-5 (publiée mais pas encore sous une forme librement diffusable) visera à préciser les codes collectifs de ISO 639-2 (ou leur équivalent dans la norme ISO 639-1 quand ils existent ; il n'y a aucun nouveau code collectif dans la norme ISO 639-3) et à en définir d’autres selon une classification scientifique la plus sérieuse possible, et les avis des linguistes et bibliothèques du monde entier (elle s’appuie largement sur les données de classification des langues déjà collectées et publiées par Ethnologue.com). Cette norme visera aussi à faciliter la localisation des logiciels et améliorer globalement le traitement des langues plus rares en les rapprochant de langues plus proches au lieu d’utiliser une langue de repli unique (souvent l’anglais dans une version simplifiée et parfois imprécise).

Voir aussi

Articles connexes

Liens externes

  • Portail des langues Portail des langues
Ce document provient de « ISO 639 ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article ISO 639-1 de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • ISO-639 — ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO 639 1)… …   Deutsch Wikipedia

  • ISO 639 — ist eine internationale Norm der Internationalen Organisation für Normung, die Kennungen für Namen von Sprachen (Sprachcodes) definiert. Die Norm besteht aus sechs Teilnormen. Fünf davon enthalten Kennungen mit zwei Buchstaben (ISO 639 1), drei… …   Deutsch Wikipedia

  • ISO 639-1 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • ISO 639-2 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • ISO 639-3 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • ISO 639-4 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • ISO 639-5 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • ISO 639-6 — ISO 639 ist ein internationaler Standard der Internationalen Organisation für Normung, der Kennungen für Namen von Sprachen (Sprachcodes) definiert. Der Standard besteht aus mehreren Teilnormen. Vier Teile für Kennungen mit zwei Buchstaben (ISO… …   Deutsch Wikipedia

  • Iso 639 — L’ISO 639 (ICS n°01.140.20) est une norme internationale l ISO qui définit des codes pour la représentation des noms de langues. Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple fi et fin sont associés au finnois.… …   Wikipédia en Français

  • ISO 639-3 — ISO/DIS 639 3 es la tercera parte de la familia de normas ISO 639, la cual tiene como objetivo codificar por medio de identificadores únicos de tres letras (Alpha 3) todos los lenguajes humanos conocidos, incluyendo vivos, extintos, antiguos,… …   Wikipedia Español

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”