International components for unicode

International components for unicode

International Components for Unicode

Page d'aide sur l'homonymie Pour les articles homonymes, voir ICU.

L'International Components for Unicode (ICU) est un projet open source qui fourni des bibliothèques pour les langages informatique C/C++ et Java pour prendre en charge Unicode, l'internationalisation et la mondialisation des logiciels. ICU est largement portable vers beaucoup de systèmes d'exploitations et d'environnements. Il donne aux applications les mêmes comportements et résultats sur toutes les plateformes et entre les logiciels C/C++ et Java. Le projet ICU est un projet qui est sponsorisé, dont les code sources sont disponibles, supporté et utilisé par IBM et beaucoup d'autres entreprises.

Certains des services fournis sont les suivants :

  • Texte : gestion de texte Unicode, propriété des caractères et les conversions de jeu de caractères
  • Analyse : Unicode expressions rationnelles; jeu Unicode complet; limites de caractère de mot et de lignes
  • Comparaison : Algorithmes de collation et de recherche sensibles à la casse
  • Transformations : normalization, majuscules/minuscules, script transliterations
  • Régionalisation : Comprehensive locale data and resource bundle architecture
  • Layout de texte complexe : arabe, hébreu, hindou/indien et thaï
  • Temps: Multi-calendriers et fuseaux horaires
  • Formatage et Parsing: dates, heures, nombres, monnaies, messages et basé sur des règles.

Origine et développement

Le travail initial d' ICU vient du framework C++ écrit par une entreprise appelée Taligent, qui fut rachetée par IBM. Certaines des fonctionnalités liées à la gestion de texte, au formatage des dates, etc. ont été réécrites en Java et devinrent les JDK 1.1 internationalization APIs, qui ont été proposées à Sun Microsystems par l'équipe ICU. Une grande portion de cela existe toujours dans les paquets java.text et java.util . ICU a été livré en tant que projet open source en 1999 sous le nom "IBM Classes for Unicode". Il fut ensuite renommé "International Components For Unicode".

Originellement, ICU a été intégralement écrit en Java. Ces fonctionnalités furent ensuite réécrites et étendues en C et en C++ pour surmonter les défauts d'internationalisation de ces langages. D'ordinaire un système d'exploitation fournit ces fonctionnalités, mais le support d'une telle API d'internationalisation n'est pas assuré de façon homogène par tous les systèmes d'exploitation.

La version Java existe aujourd'hui sous le nom ICU4J, et la version C/C++ existe aujourd'hui sous le nom ICU4C. Le projet et les deux sous-projets continuent à être développés pour les support plus avancé de Unicode/i18n .

exemple

Exemple de code utilisant la bibliothèque ICU, pour le formatage de nombres décimaux.

  #include <unicode/choicfmt.h>
  #include <unicode/unistr.h>
  #include <unicode/ustream.h>
  
  int main(int argc, char *argv[]) {
      double limits[] = {1,2,3,4,5,6,7};
      UnicodeString monthNames[] = {
          "Sun","Mon","Tue","Wed","Thu","Fri","Sat"};
      ChoiceFormat fmt(limits, monthNames, 7);
      UnicodeString str;
      for (double x = 1.0; x <= 8.0; x += 1.0) {
          fmt.format(x, str);
          cout << x << " -> "
               << str << endl;
      }
      cout << endl;
      return 0;
  }

Liens externes

Ce document provient de « International Components for Unicode ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article International components for unicode de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Regardez d'autres dictionnaires:

  • International Components For Unicode — Pour les articles homonymes, voir ICU. L International Components for Unicode (ICU) est un projet open source qui fourni des bibliothèques pour les langages informatique C/C++ et Java pour prendre en charge Unicode, l internationalisation et la… …   Wikipédia en Français

  • International Components for Unicode — (ICU) ist ein Open Source Projekt zur Unicode Unterstützung und Internationalisierung, welches ausgereifte C/C++ und Java Bibliotheken bereitstellt. ICU ist portabel und auf vielen Plattformen einsetzbar. Programme, die ICU verwenden, produzieren …   Deutsch Wikipedia

  • International Components for Unicode — Infobox Software name = International Components for Unicode caption = developer = IBM and many other companies. latest release version = 4.0 latest release date = release date|2008|07|02 latest preview version = latest preview date = operating… …   Wikipedia

  • International Components for Unicode — Pour les articles homonymes, voir ICU. International Components for Unicode (ICU) est un projet open source qui fournit des bibliothèques de traitement utilisables dans les langages informatiques C/C++ et Java, afin de prendre en charge les… …   Wikipédia en Français

  • Binary Ordered Compression for Unicode — Le BOCU 1 est un schéma de transformation du texte, compatible avec le répertoire universel d’Unicode et ISO/CEI 10646, en séquences d’octets. Il tire son nom de l’acronyme anglais de Binary Ordered Compression for Unicode (« compression… …   Wikipédia en Français

  • Binary Ordered Compression for Unicode — BOCU 1 is a MIME compatible Unicode compression scheme. BOCU stands for Binary Ordered Compression for Unicode. BOCU 1 combines the wide applicability of UTF 8 with the compactness of SCSU. This Unicode encoding is designed to be useful for… …   Wikipedia

  • Standard Compression Scheme for Unicode — The Standard Compression Scheme for Unicode (SCSU) [cite web |url=http://www.unicode.org/reports/tr6/ |title=UTS #6: Compression Scheme for Unicode |date=2005 05 06 |accessdate=2008 06 13 ] is a Unicode Technical Standard for reducing the number… …   Wikipedia

  • Binary Ordered Compression For Unicode — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes …   Wikipédia en Français

  • Binary ordered compression for unicode — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes …   Wikipédia en Français

  • Unicode — For the 1889 Universal Telegraphic Phrase book, see Commercial code (communications). The Unicode official logo since October 2009 …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”