Page suivante Page précédente Table des matières

4. Comment sauvegarder facilement vos données.

Par : Vincent Stemen

Sous UNIX et Linux, le n'ai vu jusqu'à présent que des outils conçus pour faciliter la sauvegarde sur bande. Cette méthode est souvent impossible à mettre en pratique, tout particulièrement si l'on dispose d'un petit budget. C'est pourquoi j'ai développé bu, un programme qui fait une copie conforme (mirroring) des données vers un autre système de fichiers. Bu ne se pose pas forcément en concurrent des autres méthodes de sauvegarde (bien que, sur nos serveurs utilisés pour le développement, tout le système soit fondé sur lui) mais au contraire, il en est le complément idéal. Voici comment améliorer la sécurité de vos données et simplifier vos sauvegardes sans dépenser trop.

4.1 Les inconvénients des sauvegardes sur bande.

Le prix et les capacités de stockage les rendent souvent impossibles.

La taille des disques durs, et la quantité de données stockées sur les serveurs, ou même les stations de travail, s'accroît plus vite que la capacité des lecteurs de bande bas de gamme, qui sont à la portée du particulier ou des petites entreprises. Les disques de 5 ou 8 Go sont donnés, et les plus récents peuvent contenir 11 Go, alors que la plupart des bandes ne peuvent contenir que quelques Go. Des modèles de haute performance et de plus grande capacité existent, mais seules les grosses entreprises peuvent se les payer.

Par exemple, faire des sauvegardes régulières de 30 Go de données (soit à peine 3 ou 4 disques durs) peut coûter entre 90 000 et 150 000 francs sur 2 à 4 ans, comme le montre cet article.

Et cette estimation ne prend en compte que le coût du matériel : il faudrait ajouter le coût de la main-d'oeuvre pour s'occuper du système de sauvegarde. J'y reviendrai plus tard. Mes commentaires sur la fiabilité sont fondés sur mon expérience des systèmes bas de gamme : je n'ai jamais eu quelques milliers de francs à gaspiller pour tester des solutions de meilleure qualité.

Le coût du temps perdu par les admistrateurs, et par les utilisateurs à attendre que leurs fichiers soient restaurés peut rendre l'achat de disques durs rentable.

Sauvegarder ou restaurer plusieurs Go de données sur bande peut prendre plusieurs heures. Il en est de même si l'on souhaite récupérer un seul fichier situé à la fin de la bande. Je ne saurais vous dire à quel point il est irritant d'attendre quelques heures la récupération d'un fichier, et de se rendre compte à la fin que l'on a fait une faute de frappe dans son nom, et qu'il faut tout recommencer depuis le début. De même, si vous sauvegardez de nombreux Go, et que vous voulez avoir des backups complets tous les jours, soit il faut s'en occuper fréquemment, et changer les bandes plusieurs fois par jour, soit faire des sauvegardes incrémentales entre les backups complets. Avec des bandes, cette solution pose de nouveaux problèmes.

4.2 Inconvénients des sauvegardes incrémentales sur bande.

Tout d'abord, on perd du temps à changer, à étiqueter, à dater et à classer les bandes. De plus, si vous faites des sauvegardes partielles durant la semaine, et que vous devez restaurer les données d'une machine, il est fort possible que vous passiez une journée entière à réinstaller les données dans le bon ordre depuis les bandes. Et n'oubliez pas la loi de Murphy. C'est toujours quand on a besoin de quelque chose qu'il tombe en panne. Or j'ai eu de mauvaises expériences avec les bandes : 20% ou 30% de celles à partir desquelles j'ai essayé de récupérer des données étaient défectueuses d'une façon ou d'une autre. C'est le cas sur nos DAT 2 Go. Que les bandes aient des problèmes, que les têtes soient sales, qui sait ? Lorsqu'on récupère des données à partir de sauvegardes partielles, il faut que toutes les bandes concernées soient correctes. La probabilité d'erreur est grande. Bien sûr, on peut toujours la diminuer en vérifiant la bande après chaque sauvegarde, mais cela double le temps de l'opération, qui est déjà trop longue dans la plupart des cas.

4.3 Une solution (histoire de bu).

Avec tous ces problèmes, je considérais, comme la plupart des gens que je connais, qu'il était si peu pratique de faire des sauvegardes que je n'étais jamais vraiment à jour. Et j'ai payé le prix de cette négligence une fois ou l'autre. J'ai donc réservé un peu d'espace sur un de nos serveurs et j'y copiais périodiquement mon système de fichier via nfs, en utilisant cp. Je disposais ainsi de sauvegardes récentes en cas de panne de ma machine, et je pouvais récupérer facilement et rapidement quelques fichiers, tout en me dispensant des inconvénients des bandes. Mais cela ne suffisait pas : en certaines occasions, j'étais trop pressé, et je ne voulais pas passer du temps à monter le système de fichier en NFS, à vérifier les chemins d'accès... avant de faire la copie. S'occuper des liens symboliques était aussi embêtant : si je faisais la copie d'un lien, je ne voulais pas qu'il soit « suivi » et que le fichier soit réellement copié à la place du lien, je voulais qu'il copie le vrai fichier avec son chemin d'origine, de sorte que la sauvegarde soit vraiment identique au système de fichiers de départ. Je voulais aussi disposer de fonctionnalités plus avancées, comme la sauvegarde incrémentale, sans utiliser de bandes. J'ai donc écrit bu. Il gère les liens symboliques, fait des sauvegardes incrémentales, répertoire par répertoire, permet de configurer finement quels fichiers seront sauvegarder ou pas, et tient un journal de ses actions. Il fait tout ce que fait un système de sauvegarde sur bande sophistiqué - il ne lui manque qu'une interface graphique - mais c'est un simple petit shell script.

4.4 Comment faire vos sauvegardes ?

Utiliser bu pour sauvegarder sur une autre machine ne sera pas forcément une solution aussi pratique pour vous que pour nous, mais c'est un excellent complément. Quand vous avez fait beaucoup de travail, et que vous devez pas attendre quelques heures voire quelques jours avant la prochaine sauvegarde prévue, vous êtes à la merci de Murphy, et vous n'avez plus qu'à croiser les doigts en espérant que la copie sur bande se fera correctement. Je trouve très pratique de n'avoir qu'à taper bu src pour faire une sauvegarde incrémentale de tout mon répertoire de sources, et de savoir que j'en ai une copie de plus en cas de problème.

Il est beaucoup plus rapide, et beaucoup plus facile, de restaurer un système de fichier par NFS que depuis une bande, en particulier root, et il est surtout beaucoup plus rapide de récuperer un seul fichier, simplement avec la commande cp.

En ce qui concerne les prix, on trouve des disques de 6 Go pour moins de 2000 F. En fait, on peut acheter un ordinateur complet, avec de gros disques durs, et s'en servir comme serveur de sauvegarde pour moins de 10000 F. C'est moins cher que d'acheter un lecteur de bande haut de gamme, sans compter les bandes elles-même et le temps nécessaire pour s'en occuper. L'avantage avec Linux, c'est qu'on peut faire un serveur de fichiers pour les sauvegardes à partir d'un vieux 386 ou 486.

Pour les particuliers ou les petites entreprises qui utilisent des Zip ou des Jaz pour sauvegarder, faire plusieurs copies et les emporter, bu est aussi une bonne solution, puisque les sauvegardes incrémentales peuvent se faire sur n'importe quel système de fichiers. Je m'en sers souvent pour sauvegarder sur disquette mes données les plus importantes et les mettre en sécurité.

Voici la solution que nous avons adopté avec bu. C'est la moins chère qui soit, dans les conditions de travail qui sont les nôtres. Nous nous en servons pour sauvegarder les données de nos serveurs de développement, qui contiennent plusieurs Go de données. Utilisez bu pour faire des sauvegardes quotidiennes sur des systèmes de fichier de moins de 640 Mo. Une fois ou deux par mois, gravez des CD à partir de ces systèmes de fichiers, et stockez-les. Les CD vierges coutent à peine 10 F l'un, par 100, et les graveurs sont devenus abordables. Vos sauvegardes sont ainsi stockées sur des supports qui ne se détériorent pas, à l'inverse des disquettes ou des bandes magnétiques. Les CD réinscriptibles sont aussi intéressants, si vous pouvez dépenser un peu plus. Si vous avez trop de données à protéger, il est possible d'utiliser plusieurs disques durs en alternance. Le mieux est alors d'avoir un rack pour pouvoir les débrancher directement depuis l'avant de la machine. Là ou bu sera vraiment le plus adapté pour gérer de très grosses quantités de données, c'est quand les DVD réinscriptibles seront à des prix abordables. À ce moment là, faire des sauvegardes sur des supports à accès non aléatoire tombera en désuétude.

4.5 Où se procurer bu ?

Bu peut être télécharger à partir des URL suivantes :


Publié dans le Numéro 32 de la Linux Gazette -- Septembre 1998

Vincent Stemen

Adaptation française : Marc Simon.


Page suivante Page précédente Table des matières