Sauvegarde

Sauvegarde
Page d'aide sur l'homonymie Pour les articles homonymes, voir Sauvegarde (homonymie).

En informatique, la sauvegarde (backup en anglais) est l'opération qui consiste à dupliquer et à mettre en sécurité les données contenues dans un système informatique.

Ce terme est proche de deux notions :

  • l'enregistrement des données, qui est l'opération d'écriture des données sur un item d'enregistrement durable, tel qu'un disque dur, une clé USB, des bandes magnétiques, etc.
  • l'archivage, qui consiste à enregistrer des données sur un support à des fins légales ou historiques.

La sauvegarde passe forcément par un enregistrement des données, mais pas nécessairement dans un but d'archivage.

Sommaire

Finalité

Les copies de sûreté sont utiles principalement à deux choses :

  • La première et la plus évidente est de permettre de restaurer un système informatique dans un état de fonctionnement suite à un incident (perte d'un support de stockage tel que disque dur, bande magnétique, etc., ou de tout ou partie des données qu'il contient).
  • La seconde, incluse dans la première mais certainement la plus courante, est de faciliter la restauration d'une partie d'un système informatique (un fichier, un groupe de fichiers, un système d'exploitation, une donnée dans un fichier, etc.) suite à une suppression accidentelle ou à une modification non désirée.

La technique la plus fréquente est la recopie des données sur un support indépendant du système initial (ordinateur local, serveur, etc.).

L'opération inverse qui consiste à réutiliser des données sauvegardées s'appelle une restauration. On parle de « stockage » pour les données sauvegardées en attente d'une éventuelle restauration.

Critères de choix

Le choix d'une technique de sauvegarde se fera en prenant en compte :

  • la capacité de stockage du support (le volume d'information)
  • la vitesse de sauvegarde,
  • la fiabilité du support (notamment après une longue période de stockage),
  • la simplicité de classement,
  • la facilité à restaurer les données,
  • et bien sûr le coût de l'ensemble.

Intervient également la possibilité de sélectionner les données à sauvegarder. Enfin pour les grands systèmes de sauvegarde, il faut tenir compte de critères physiques : volume physique des supports de stockage, poids, sensibilité à la température, à l'humidité, à la poussière, à la lumière.

Stratégies de sauvegarde

On distingue la sauvegarde d'un poste individuel et la sauvegarde sur serveur. L'une et l'autre s'adressent à la même nature d'information (la donnée informatique) et ont le même objectif (protéger l'information et permettre de la retrouver si elle était perdue), mais les méthodes de sauvegarde sont différentes pour plusieurs raisons :

  • les données sur poste client sont réputées moins importantes que les données gérées sur des systèmes centraux ;
  • les utilisateurs sont moins sensibilisés au risque de perte de données que les professionnels de l'informatique ;
  • ils ont également moins de formation sur les techniques de sauvegarde ;
  • les moyens techniques sont moins développés sur poste individuel que sur serveur, même si des progrès importants ont été réalisés ces dernières années (chute du rapport coût/volume des supports de sauvegarde, simplification des interfaces de sauvegarde, sauvegarde sans intervention de l'utilisateur, etc.)

De fait la sauvegarde des données des postes individuels reste marginale dans la stratégie d'utilisation des ordinateurs. Cependant les entreprises, en généralisant l'usage des micro-ordinateurs et du partage des ressources en réseau, ont ressenti un besoin de sécurité qui a favorisé le développement d'outils de sauvegarde sur micro-ordinateurs, lesquels gagnent petit à petit le monde de la micro-informatique personnelle.

Sauvegarde sur serveur

La sauvegarde s'inscrit dans une démarche plus globale qui consiste à assurer la continuité d'activité d'un système informatique ou, en cas de défaillance, son redémarrage le plus vite possible. Cette démarche est souvent formalisée dans un document qui peut porter des noms divers, par exemple le Plan de reprise d'activité (PRA) ou le plan de secours, et qui fait appel soit à des automatismes (ex. donner l'alerte en cas de coupure de courant ou de perte d'accès à une unité de stockage) soit à des gestes manuels (ex. remplacer des bandes magnétiques défectueuses). La tendance est à l'automatisation, réputée plus sûre dans les situations d'urgence que les opérations manuelles.

En termes de support, les serveurs ont depuis toujours requis des supports à grande capacité de stockage. La bande magnétique a longtemps été le principal vecteur, du fait de sa grande capacité, de son coût faible (par rapport aux autres supports), de sa capacité de réutilisation et de sa relative stabilité au temps et à l'usure. Puis sont venus les cartouches numériques (bandes magnétiques intégrées dans un boîtier plastique type DAT, DLT, SDLT, LTO), les disques durs et plus récemment les médias optiques, réinscriptibles ou non, tels que les CD-R, DVD-R ou formats similaires.

Sauvegarde sur système client

Au cours des années 1975–95, la plupart des utilisateurs d'ordinateurs personnels (PC) associaient principalement le terme "backup" au fait de faire des copies sur disquettes. Avec le développement de micro-ordinateurs mieux équipés, les utilisateurs personnels ont adopté des supports plus performants : disques optiques (CD-ROM ou DVD), clés USB. De même, les ordinateurs intègrent des fonctions de sauvegarde de plus en plus évoluées, par exemple :

  • des outils intégrés au système d'exploitation tels que les "points de restauration" que l'on peut exécuter avant d'installer un nouveau logiciel et qui remettront le système en l'état d'avant l'installation si l'utilisateur le demande ;
  • des logiciels capables de faire une image parfaite du système à un moment donné (image appelée un "ghost", en référence au logiciel du même nom, mot qui signifie "fantôme" en anglais) ; cette image sera stockée sur l'ordinateur lui-même ou sur un support externe.

Sauvegarde sur Internet

Avec la banalisation des connexions Internet à large bande et à haut débit, de plus en plus d’utilisateurs recourent à ce type de service de sauvegarde. On peut différencier deux méthodes:

Sauvegarde en ligne

Aujourd'hui, les copies de sûreté dites « en ligne »[1] deviennent populaires Elles consistent à se connecter à un site Internet, appelé « hébergeur », et à y transférer ses données. Les avantages sont multiples :

  • minimiser le risque de perte puisque le site est géré par un professionnel qui fait lui-même des sauvegardes ;
  • accéder à ses données à partir de n'importe quel ordinateur connecté à Internet ;
  • souvent le coût de cette prestation est modique, parfois même gratuit pour les petites sauvegardes.

L'inconvénient majeur est de laisser ses données à disposition d'un tiers qui peut à loisir les consulter, les modifier, les dupliquer, les publier ou en faire commerce ; et même les rendre indisponibles (cas des faillites, rachats de sites par des concurrents, ou différend commercial avec l'hébergeur). Évidemment, des dispositions contractuelles viennent réguler ces risques mais elles ne peuvent empêcher l'hébergeur d'agir techniquement de façon malveillante. Une des parades à la consultation abusive consiste à chiffrer / crypter les données.

Un autre inconvénient vient des limites imposées sur le stockage ou la récupération des données : pour maîtriser l'usage de ses disques et de sa bande passante, un hébergeur peut limiter contractuellement son client à un volume de stockage ou de données consultées au-delà duquel il bloque l'accès aux données.

Ce qu'il faut retenir d'important dans l'utilisation de ce processus de sauvegarde en ligne sont les critères suivants :

  1. Les données doivent êtres cryptées/chiffrées avant de remonter via Internet chez l'hébergeur. Ce qui induit que le prestataire ne peut pas exploiter les données du client par définition.
  2. L'hébergeur se doit d'avoir deux copies de vos données, pour se prémunir aussi d'une panne de son côté. (Si possible sur des réseaux différents, des réseaux électriques différents, voir une infrastructure géographique différente). Ne pas oublier que si le client à une panne en même temps que le prestataire, la solution est caduque pour le client dans ce cas de figure.
  3. L'hébergeur doit avoir vis-à-vis des professionnels une assurance "Responsabilité d'Exploitation" adéquate avec le service proposé, afin que le client dans un cas ultime "puisse être couvert."
  4. Le tarif des solutions n'est pas le plus important, le plus important sont la mise à disposition des données, et la couverture du prestataire.

Sauvegarde en Pair à pair (P2P)

L'évolution des méthodes d'échange de fichier rendent depuis un certain temps possible la sauvegarde en mode "Pair à Pair". Cette technique s'appuie sur un service collaboratif ou chacun protège ses données sur les espaces de stockage des autres.

Les avantages sont multiples :

  • minimiser le risque de perte et disposer d'une protection à distance répondant aux problèmes de vol, incendie, inondation;
  • les espaces de stockage ne sont pas limités en taille;
  • entièrement gratuit;
  • une sauvegarde entièrement automatisée et périodique;

L'inconvénient majeur de cette technique est qu'elle s'adresse uniquement aux particuliers mais ne répond pas aux besoins des entreprises; il faut veiller à ce que les données soient entièrement encryptées afin de les rendre illisibles sur les espaces de stockage des autres. Cette technique doit s'inscrire au sein de groupe de confiance.

Méthodes (Types) de sauvegarde les plus courantes

La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi "full backup") ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non.

Cette méthode est aussi la plus fiable mais elle est longue et très coûteuse en termes d'espace disque, ce qui empêche de l'utiliser en pratique pour toutes les sauvegardes à effectuer. Afin de gagner en rapidité et en temps de sauvegarde, il existe des méthodes qui procèdent à la sauvegarde des seules données modifiées et/ou ajoutées entre deux sauvegardes totales. On en recense deux :

  • La sauvegarde différentielle
  • La sauvegarde incrémentielle

La restauration d'un disque avec l'une de ces méthodes s'avère plus longue et plus fastidieuse puisqu'en plus de la restauration de la sauvegarde différentielle ou des sauvegardes incrémentielles, on doit également restaurer la dernière sauvegarde complète. Les fichiers supprimés entre-temps seront restaurés ou non (en fonction des fonctionnalités du logiciel de sauvegarde utilisé)

Afin de comprendre la différence entre les deux méthodes, nous prendrons l'exemple d'un plan de sauvegarde selon le cycle suivant :

  • Une sauvegarde complète au jour J (dimanche soir par exemple)
  • Une sauvegarde des fichiers modifiés ou nouveaux du jour J+1 au jour J+6 (du lundi soir au samedi soir inclus)
  • Une sauvegarde complète au jour J+7 (dimanche soir suivant)

Mécanisme

Pour pouvoir différencier ces différentes méthodes de sauvegarde/archivage (complète, incrémentielle, différentielle), le mécanisme mis en place est l'utilisation d'un marqueur d'archivage. Chaque fichier possède ce marqueur d'archivage, qui est positionné à "vrai" lorsque l'on crée ou modifie un fichier. On peut comprendre cette position comme "Je viens d'être modifié ou créé : je suis prêt à être archivé donc je positionne mon marqueur à vrai". Ce marqueur est appelé aussi attribut d'archivage (ou bit d'archivage). Sous Windows, cet attribut est modifiable et peut être visualisé par la commande ATTRIB (attribut A pour archive). Le système de sauvegarde peut aussi constituer une base de données contenant les définitions des fichiers et utiliser un marquage interne.

Sauvegarde complète

Lors d'une sauvegarde complète, on va remettre à "0" l'attribut du fichier pour mémoriser le fait que le fichier a été enregistré. Lorsque l'on travaille avec la date, on mémorise la date de la dernière sauvegarde de façon à pouvoir différencier les fichiers qui ont été sauvegardés des autres (date de dernière modification).

Détail technique

Lors d'une sauvegarde complète, tous les fichiers sont sauvegardés, indépendamment de la position du marqueur (vrai ou faux). Une fois le fichier archivé, celui-ci se voit attribuer la position de son marqueur (ou son bit) à "faux" (ou à "0").

Sauvegarde différentielle

La sauvegarde différentielle effectue une copie des fichiers créés ou modifiés depuis la dernière sauvegarde complète, quelles que soient les sauvegardes intermédiaires. En d'autres termes, la sauvegarde complète du jour J sert de référence pour identifier les fichiers créés, modifiés ou ajoutés et ainsi ne sauvegarder que ces derniers du jour J+1 au jour J+6.

La restauration faite à partir de ce type de sauvegarde nécessite la recopie sur disque de la dernière sauvegarde complète et de la sauvegarde différentielle la plus récente.

Avec notre exemple, si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+2, on doit alors recopier sur disque la sauvegarde complète du jour J et la sauvegarde différentielle du jour J+2 afin d'avoir la dernière version des données.

Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+2 seule la dernière sauvegarde, ici la différentielle, est utile.

Détail technique

Lors d'une sauvegarde différentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci garde la position de son marqueur tel qu'il l'avait avant la sauvegarde.

Sauvegarde incrémentale ou incrémentielle

Cette méthode consiste à sauvegarder les fichiers créés ou modifiés depuis la dernière sauvegarde quel que soit son type (complète, différentielle ou incrémentielle).

Exemple : une sauvegarde complète est réalisée le jour J. Le jour J+1, la sauvegarde incrémentielle est réalisée par référence au jour J. Le jour J+2, la sauvegarde incrémentielle est réalisée par référence au jour J+1. Et ainsi de suite.

Si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+4, on doit alors recopier sur disque la sauvegarde du jour J et les sauvegardes incrémentielles des jours J+1, J+2, J+3 et J+4 afin d'obtenir la dernière version de la totalité des données.

Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+3, seule la dernière sauvegarde, ici l'incrémentielle, est utile.

La sauvegarde incrémentale peut également porter sur les seuls octets modifiés des fichiers à sauvegarder. On parle alors de sauvegarde incrémentale octet. Cette méthode est celle qui permet d'optimiser le plus l'utilisation de la bande passante. Elle rend possible la sauvegarde de fichiers de plusieurs Gigaoctets, puisque seul un pourcentage minime du volume est transféré à chaque fois sur la plateforme de sauvegarde.

Détail technique

Lors d'une sauvegarde incrémentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci se voit attribué la position de son marqueur à "faux".

Sauvegarde, archivage et rétention

La rétention permet de faire la différence entre sauvegarde et archivage.

La rétention est le temps pendant lequel la donnée sauvegardée est conservée intacte. Un travail de rétention courte est assimilé à un travail de sauvegarde classique : la donnée est protégée contre sa disparition/son altération. Un travail de rétention longue (une ou plusieurs années) est assimilé à un travail d'archivage et aura pour but de retrouver la donnée à une date précise, sur demande express.

Exemple : une rétention de 4 semaines implique que l'instance des données sauvegardées à une date précise seront toujours disponibles jusqu'à 28 jours après leur sauvegarde. Après ces 28 jours, d'un point de vue logique, les données n'existent plus dans le système de sauvegarde et sont considérées comme introuvables. Physiquement, les pistes utilisées pour enregistrer cette sauvegarde peuvent être effacées.

Plus la rétention est longue et plus le nombre d'instance sauvegardé pour un même objet fichier ou dossier est important. Plus la rétention est longue et plus la sauvegarde tend vers un mécanisme d'archivage qui nécessitera un système de recherche et d'indexation approprié. Plus la rétention est longue et plus l'espace nécessaire pour stocker les travaux de sauvegarde sera important.

Formule de calcul de l'espace de sauvegarde nécessaire

Cette formule permet de dimensionner une librairie de sauvegarde (bande ou disque VTL).

Dans le cas d'une sauvegarde classique, c'est-à-dire sauvegarde totale le week-end (vendredi soir) et sauvegardes incrémentielles les autres jours ouvrés de la semaine, du lundi au jeudi (pas le vendredi) soit quatre jours :

- soit D l'espace de donnée utile à sauvegarder,

- soit R la rétention des travaux souhaité, exprimé en semaine,

- soit T le taux de modification par jour des fichiers de l'espace à sauvegarder,

la formule suivante est obtenue : D x R + (D x T%) x 4 = capacité de sauvegarde.

Exemple chiffré : 100 Go au total à sauvegarder avec une rétention de 3 semaines et un taux de modification de 20% par jour donne 100 x 3 + (100 x 20%) x 4 = 380 Go. 380 Go seront nécessaires pour sauvegarder nos 100 Go de données avec une rétention de 3 semaines et une modification de 20% par jour.

Des innovations technologiques telles que les snapshots ou la déduplication permettent de réduire cette valeur d'une façon très intéressante.

Techniques complémentaires

La sauvegarde de données peut être réalisée en utilisant des techniques plus ou moins sophistiquées. La méthode la plus simple est de parcourir les répertoires et les fichiers d'un poste de travail ou d'un serveur, mais on se trouve vite limité par le nombre de fichiers et par le volume de données, qui ont un impact direct sur le temps de sauvegarde. Pour contourner ces limitations, plusieurs approches sont envisageables:

  • compression des données sauvegardées, utilisé par la majorité des solutions de sauvegarde
  • technique de snapshot: prise d'image instantanée d'un disque, en particulier dans un SAN (voir Gestion par volumes logiques)
  • sauvegarde en mode bloc (protocole NDMP en particulier pour les NAS)
  • technique de déduplication pour limiter le volume des sauvegardes en éliminant les doublons
  • technique de déduplication à la source permettant de ne stocker qu'une seule fois un fichier, même si celui-ci a été dupliqué et renommé sur les postes sauvegardés, les doublons n'étant présents que dans les index
  • une combinaison de ces différentes techniques

Notes

  1. Traduction littérale du terme anglo-saxon on line qui signifie « connecté »

Système de sauvegarde avec NAS

  • Intradisk : Solutions de sauvegarde et d'archivage Intradisk-CIBS (Cascaded Internet Backup System)
  • Beemo Technologie: Data Safe Restore: Solution hybride de sauvegarde locale et externalisée dans 2 Data centers sécurisés

Logiciels de sauvegarde

Articles connexes


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Sauvegarde de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • sauvegarde — Sauvegarde, C est la tuition et deffence en laquelle aulcun est tenu par aultruy, Tutela, Clientela, Protectio, Salui habitio. Ainsi on dict le roy avoir mis aucun, ses famille et biens en sa sauvegarde, Se tuitorem alicuius et familiae rerumque… …   Thresor de la langue françoyse

  • sauvegarde — 1. (sô ve gar d ) s. f. 1°   Protection accordée par une autorité quelconque. Le magistrat l a pris sous sa sauvegarde. 2°   La garde, le détachement qu un chef militaire envoie dans un lieu pour le garantir du pillage. •   S il vient jamais… …   Dictionnaire de la Langue Française d'Émile Littré

  • sauvegarde — Sauvegarde. s. f. Exemption de logement de gens de guerre que l on donne à certaines maisons. Il a une sauvegarde du colonel du Regiment des gardes …   Dictionnaire de l'Académie française

  • Sauvegarde — Sau ve*garde , n. [F.] (Zo[ o]l.) The monitor. [1913 Webster] …   The Collaborative International Dictionary of English

  • Sauvegarde — (fr., spr. Sowgard), so v.w. Salvegarde …   Pierer's Universal-Lexikon

  • Sauvegarde — (franz., spr. ßōw gárd , früher Salvaguardia), Schutzwache, die ein Truppenführer in Feindesland einzelnen Personen, Häusern etc. bewilligt, um sie vor Plünderung und Mißhandlung zu sichern; wohl auch Bezeichnung des zu gleichem Zweck erlassenen… …   Meyers Großes Konversations-Lexikon

  • Sauvegarde — (spr. ßow gárd), Schutzwache; auch Schutzbrief …   Kleines Konversations-Lexikon

  • Sauvegarde — (sowgard), ital. Salvaguardia, Schutzwache, welche ein Commandant in Feindesland Personen, Gebäuden etc. zum Schutze beigibt …   Herders Conversations-Lexikon

  • sauvegarde — 1. sauvegarde [ sovgard ] n. f. • salve garde 1155; de sauf et garde 1 ♦ Protection et garantie (de la personne, de la liberté, des droits) accordées par une autorité ou assurées par une institution. SOUS LA SAUVEGARDE DE... Se placer sous la… …   Encyclopédie Universelle

  • SAUVEGARDE — s. f. Protection accordée par le souverain, par une autorité quelconque. Il est en la protection et sauvegarde du roi. On l a mis en la protection et sauvegarde du roi et de la justice. Le magistrat l a pris sous sa sauvegarde.   Il se dit aussi… …   Dictionnaire de l'Academie Francaise, 7eme edition (1835)

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”