- Stockage d’information
-
Stockage d'information
En informatique, le stockage d'information est l'enregistrement de l'information sur un support matériel pour sa réutilisation future.
Le stockage d'information répond à trois besoins, non exclusifs les uns des autres :
- conserver l'information en lieu sûr pour répondre à une contrainte légale ou conventionnelle (archivage des données) ;
- rendre l'information disponible ;
- réutiliser l'information (traitement des données).
Le stockage d'information se fait bien évidemment sur un support d'information électronique, et néanmoins matériel. L'existence même du stockage d'information montre que le terme de dématérialisation, employé pour le passage d'un support d'information papier à un support électronique, est peu approprié, puisque le nouveau support d'information est lui aussi matériel.
Le choix de la méthode de stockage se fait selon plusieurs critères :
- la fréquence d'utilisation de l'information ;
- la criticité de l'information ;
- la pérennité de l'information ;
- la confidentialité de l'information ;
- le volume d'information à stocker ;
- le temps alloué au processus de stockage ;
- et son coût.
Le mot d'ordre des techniques de stockage est : plus de capacité, plus vite, plus fiable, et moins cher. C'est pourquoi les types de média sont variés et évoluent souvent.
Sommaire
Typologie des technologies de stockage
Classiquement, on oppose le stockage de masse, plutôt lent mais permettant de gérer des volumes importants de données sur du long terme, et le stockage à accès rapide, principalement utilisé comme mémoire de travail.
Stockage de masse
L'objectif est de stocker une grande quantité d'information à long terme. On peut distinguer plusieurs générations :
- Première génération
- les supports physiques, avec la carte perforée et le ruban perforé. Ces supports sont obsolètes en 2009.
- Deuxième génération
- les supports magnétiques, comme la bande magnétique, sa petite sœur la cassette, le disque dur, la disquette. Les bandes magnétiques ne sont plus utilisées que pour la sauvegarde ou l'archivage des données (ex. LTO). Elles restent néanmoins un support privilégié de sauvegarde et d'archivage des données en raison de leur très grande capacité et de leur caractère amovible qui permettent de les délocaliser aisément[1]. Ainsi, en 2008, les bandes ou cartouches accueillent couramment plus de 200 gigaoctets.
- Troisième génération
- les supports optiques, tels que le disque compact (CD, CD-R ou CD-RW), le DVD (DVD-Rom ou DVD-RW) ou le Blu-ray.
En 2008, certains parlent de la mémoire du réseau Internet, car une information publiée sur Internet y reste sans qu'il soit aisé de la contrôler (la modifier, la supprimer ou restreindre son accès).
Stockage à accès rapide, mémoire de travail
Parallèlement, des mémoires plus chères mais très rapides ont été implantées sur des puces pour faciliter le traitement des informations en interne dans les ordinateurs :
- la mémoire vive (ou mémoire RAM pour Random Access Memory), qui ne vit que tant que l'ordinateur est allumé et s'efface quand on l'éteint ;
- la mémoire morte (ou mémoire ROM pour Read-Only Memory), qui est gravée et ne s'efface jamais (ex: NVRAM) ;
- l'EPROM et l'EEPROM (mémoire morte réinscriptible), qui ont évolué en mémoire flash, donnant naissance aux récentes clés USB, concurrentes directes des anciennes disquettes.
Problématiques du stockage
Comment a-t-on pu au cours du temps stocker des données informatiques en nombre croissant sur des supports de plus en plus réduits ?
Volumétries des données
Un des points critiques de l'évolution informatique est l'inflation du volume d'information. Même si la capacité de stockage, à prix constant, suit la loi de Moore définie pour les processeurs, le volume à stocker a augmenté de manière exponentielle, et le stockage constitue une problématique des entreprises en termes de coût (il consomme actuellement une grande partie du budget informatique) et de gestion des données stockées (où les conserver et comment les réutiliser).
Pour contrecarrer cette dépendance aux limitations d'espace disponibles des supports physiques (voir enregistrement), les algorithmes de compression de données présentent, avec le stockage partagé, les plus grands espoirs pour demain.
Le stockage partagé (SAN) présente certes les plus grands espoirs pour demain mais est à double tranchant car les données (les données privées par exemple) sont justement partagées. Et ceux qui conservent les données peuvent aussi les consulter, bien que cela soit interdit ou restreint par l'éthique, par mot de passe, par contrat, ou par la loi. Mais quelle est la loi applicable si les données ne sont pas dans le pays où vous résidez, ou si les données peuvent être stockées dans plusieurs pays à la fois (voir ci-dessous concernant les « fermes » de serveurs) ? Il est nécessaire de savoir à qui l'on confie les données.
De plus, concernant le stockage partagé et hormis les problèmes de sécurité des données, les « fermes » de serveurs sur PC qui sous-tendent les grands sites web d'aujourd'hui gèrent des volumes de données incomparablement plus importants que les plus grands des ordinateurs centraux d'antan. Les technologies d'archivage sur bande ont suivi cette même approche modulaire : chaque baie peut contenir une dizaine ou une vingtaine de bandes magnétiques et les baies peuvent se regrouper, par exemple par 8 ou 10, pour une capacité totale allant jusqu'à plusieurs dizaines de téraoctets. Les bibliothèques de bandes sont à l'heure actuelle considérées comme le moyen le plus accessible d'assurer la sauvegarde et l'archivage de toutes ces données.[1]
Avec l'utilisation des nanotechnologies, la capacité de stockage informatique n'est pas un problème à l'horizon 2020 ; par exemple, il suffit de placer les zéros sur des carbones 12 et les uns sur des isotopes 13. Par ailleurs, 2 terabytes suffisent à mémoriser tous les textes, images et sons utilisés en moyenne annuellement par un être humain. L'immortalité devient tangible[2].
Fiabilité des supports
Du fait de leur constitution physique, tous les supports de stockage ont une durée de vie limitée, entraînant un risque de perte d'information. Pour s'en affranchir, il faut constamment les vérifier et recopier les données sur des supports fiables. Aujourd'hui, une branche de la théorie de l'information vient porter remède en cas d'altération partielle des données : la technique des codes correcteurs, utilisée notamment dans les installations RAID. La redondance de l'information reste malheureusement le seul rempart face au manque de fiabilité des supports.
Confidentialité des données
Pour ce qui est de la confidentialité, la cryptographie propose des solutions de chiffrement, qui reposent sur différentes méthodes :
- la cryptographie à clef publique (algorithme RSA entre autres) ;
- la cryptographie à clef secrète (algorithmes DES, AES entre autres).
Notes et références
- ↑ a et b http://01Net.com/
- ↑ (en) Jaap Bloem, Menno van Doorn, Sander Duivestein, Me the media: rise of the conversation society, VINT reseach Institute of Sogeti, 2009, p.273.
Voir aussi
Article connexe
Catégories : Théorie de l'information | Stockage informatique
Wikimedia Foundation. 2010.