- Numerisation
-
Numérisation
La numérisation est le procédé permettant la construction d'une représentation discrète d'un objet du monde réel.
Dans son sens le plus répandu, la numérisation est la conversion d'un signal (vidéo, image, audio, caractère d'imprimerie, impulsion, etc.) en une suite de nombres permettant de représenter cet objet en informatique ou en électronique numérique[1]. On utilise parfois le terme franglais digitalisation (digit signifiant chiffre en anglais).
Sommaire
Principe
Essentiellement, la numérisation est la projection dans un espace discret choisi de grandeurs analogiques réelles. La numérisation consiste à effectuer une ou plusieurs mesures des grandeurs que l'on veut représenter en s'intéressant à un ou plusieurs axes :
- l'axe spatial, où on discrétise suivant une longueur par exemple tous les millimètres d'une surface ; on parle alors d'échantillonnage spatial ;
- l'axe temporel ou fréquentiel, ou l'on va discrétiser une même grandeur au cours du temps ; on parlera d'échantillonnage temporel ;
- l'axe d'intensité ou l'on va discrétiser suivant une unité d'intensité comme la candela pour l'intensité lumineuse : c'est la quantification.
Le résultat de cette numérisation est un nombre ou une suite de nombres représentant la grandeur mesurée suivant les axes choisis. Le choix judicieux de l'espace discret est crucial pour que l'objet numérisé soit représentatif de l'objet initial.
Il existe des contraintes à respecter pour obtenir une numérisation fidèle de la réalité :
- un échantillonnage suffisamment fin pour suivre les évolutions de l'objet à numériser : le théorème de Shannon impose une résolution d'échantillonnage minimum ;
- une quantification suffisamment précise pour ne pas dégrader la représentation ; le bruit de quantification (bruit blanc uniforme de variance 1/12) doit rester négligeable devant le bruit avant numérisation.
Procédés de numérisation
La numérisation est une des manières de créer des données à traiter. Les procédés sont différents selon l'origine du signal à numériser :
- La numérisation directe de textes et d'images s'effectue à l'aide d'un scanneur, qui convertit les niveaux de lumière et les couleurs en données binaires. Le résultat peut alors être stocké dans un fichier informatique et édité dans un logiciel spécialisé : logiciel de traitement de texte pour les fichiers textes qui ont été convertis par reconnaissance optique de caractères, programme de retouche d'image pour les Images numériques, etc. L'appareil photo numérique, dont le capteur convertit l'image photographiée sous forme numérique, peut aussi servir à numériser des documents imprimés.
- La numérisation d'images vidéo est assurée soit directement par la source (webcam, caméra numérique, camescope numérique), soit par des convertisseurs dans le cas d'un signal analogique : boîtier ou carte d'acquisition vidéo équipé de convertisseurs analogique-numérique. Différentes sortes d'enregistreurs numériques sont spécialisés dans la numérisation d'images télévisées : numériscope, enregistreurs sur disque dur ou sur DVD, etc.
- La numérisation de son est aussi obtenue au moyen de convertisseurs analogique-numérique, lesquels peuvent être intégrés au matériel d'enregistrement (notamment dans le cas des dictaphones numériques et des baladeurs numériques avec fonction d'enregistrement) ou grâce à des logiciels qui exploitent les capacités de calcul d'un ordinateur. Dans le domaine de la musique, la numérisation de son est communément appelée échantillonnage ou sampling.
Dans tous ces cas, la suite de nombres obtenus peut être réduite par des techniques de compression de données pour gagner en taille et en bande passante. Quand le résultat est stocké dans un fichier, le format des données utilisé peut poser des problèmes de compatibilité.
Composants électroniques de numérisation
Des composants spécialisés assurent la conversion dans un système numérique des données analogiques recueillies par divers capteurs (cellule photo-sensible, thermomètre...).
Convertisseur analogique-numérique
En électronique, une chaîne de conversion A/N (analogique vers numérique) contient les éléments suivants :
- une ou plusieurs sources analogiques,
- un filtre anticrènelage (anti-aliasing) par source,
- un multiplexeur (MuX), qui pourra servir pour sélectionner une source parmi plusieurs (entrées multiples mais une seule sortie),
- un échantillonneur bloqueur (Sample and Hold ou S/H), qui garde la tension stable le temps du codage,
- le convertisseur analogique-numérique proprement dit (Analog/Digital Converter ou ADC),
- un codeur (ou modulateur).
La conversion suit donc le chemin suivant :
Source analogique -> filtre anticrènelage -> Mux -> S/H -> CAN -> Codeur -> Signal numérique (transmission ou traitement)
Convertisseur numérique-analogique
À l'inverse, une chaîne de passage d'un signal numérique vers un signal analogique contiendra les éléments suivants :
- un décodeur (ou démodulateur),
- un convertisseur numérique-analogique (CNA),
- un démultiplexeur (Demux),
- un filtre de lissage, qui va tenter de recréer les valeurs intermédiaires,
- une sortie analogique.
La conversion suit le chemin suivant :
Source numérique -> Décodeur -> CNA -> Demux -> Filtre de lissage -> Signal analogique
Le choix des termes (dé)codeur et (dé)modulateur a donné leur nom aux codecs (codeurs/décodeurs) et aux modems (modulateurs, démodulateurs).
Numérisation et archivage
Les objectifs de la numérisation sont nombreux. Dans les domaines de la Gestion Électronique des Documents et des sciences de l'information et des bibliothèques, elle remplit plusieurs fonctions :
- préserver et protéger des documents contre les risques d'altération (l’acidité par exemple)
- archiver des documents originaux en vue d'un gain de place, et les dupliquer sans risque de dégradation pour les mettre à disposition du public
- permettre au public de consulter et d'accéder à des documents anciens et/ou rares
- aider et susciter la recherche, faciliter l'indexation de textes et de documents multimédias, valoriser un fonds documentaire
- donner accès à la connaissance à distance dans une perspective de communication (bibliothèques électroniques en ligne, projet « Bibusages » sur Internet, etc.)
La numérisation est l'un des aspects de ce que l'on appelle quelquefois de façon impropre la dématérialisation.
Plusieurs grands chantiers de numérisation du patrimoine culturel ont été lancés dans le monde.
« Open Content Alliance » (OCA)
Le consortium OCA est une association américaine qui regroupe des entreprises privées telles Yahoo !, Adobe, HP, Internet Archive [2], des bibliothèques (BU Californie, BU Toronto), des centres d’archives et des éditeurs. Le 25 octobre 2005, Microsoft a rejoint ce groupe.
L'OCA a pour objectif de numériser et de mettre en ligne une banque de données accessible à tous, pérenne et multilingue (banque de données composée de documents multimédias). Cependant, elle prend uniquement en compte les fonds patrimoniaux libres de droits à la différence de Google Recherche de livres. Aucune numérisation ne sera faite sans la permission des ayant-droits. Ces derniers peuvent contribuer au projet en définissant l’étendue de la diffusion avec d’éventuelles restrictions.
Google Recherche de livres
Annoncé le 14 décembre 2004 par les co-fondateurs de la société Google, le programme « Google Print » est chargé de numériser 15 millions d’ouvrages, ce qui représente 4,5 milliards de pages en 6 ans selon Jean-Noël Jeanneney, alors président de la Bibliothèque nationale de France. Cinq bibliothèques ont donné leur accord pour numériser leurs fonds : les bibliothèques de l'université d’Harvard, de l'université du Michigan et de l'université Stanford, la New York Public Library et la Bodleian Library de l'université d'Oxford. Google Print est officiellement lancé en novembre 2005 avec un ensemble de livres numérisés du domaine public et issus des partenaires du projet. Il est rebaptisé à la mi-novembre « Google Books Search » (« Google Recherche de livres » en français). De nouveaux accords ont été passés entre Google et d'autres universités pour enrichir cette bibliothèque numérique.
La Bibliothèque Numérique Européenne
Le 22 janvier 2005, le président de la Bibliothèque nationale de France, Jean-Noël Jeanneney, lance dans le quotidien Le Monde un appel pour réagir à l'initiative de Google. Fin avril 2005, les bibliothèques nationales de 19 pays puis six chefs d’Etat et de gouvernement européens appellent à une coopération européenne pour la création d’une bibliothèque numérique européenne (Europeana). Un an plus tard s'ouvre The European Library, le portail multilingue de la BNE. Outre les bibliothèques nationales des 25 pays concernés qui coopèrent au projet, quelques pays d’Amérique latine (Brésil, Chili, Pérou) sont intéressés par la Bibliothèque Numérique Européenne. Quelques bibliothèques au Canada et surtout à Québec, mais aussi à Alexandrie en Égypte participeront à la BNE.
L'objectif de ce projet est de numériser 2 millions de documents (livres, films, photographies, manuscrits et autres œuvres culturelles) en 2008, puis de donner accès à 6 millions de documents en 2010, soit un peu plus d’un tiers du fonds numérique de Google Books Search.
Notes et références
- ↑ Définition du Répertoire terminologique 2000 de la Commission générale de terminologie et de néologie
- ↑ Service qui assure l'archivage du Web depuis 1996.
Voir aussi
Liens externes
- Portail de l’informatique
- Portail de l’électricité et de l’électronique
Catégories : Collecte de données | Format de données numériques | Traitement numérique du signal | Périphérique d'entrée
Wikimedia Foundation. 2010.