Qu’est-ce qu’une sauvegarde?
Définition
La sauvegarde est le processus qui consiste à créer une copie de vos données. Lorsque vous faîtes un copier-coller de vos photos de vacances depuis votre appareil photo vers votre ordinateur ou votre clef USB, c’est un peu la même chose.
Une sauvegarde, c’est un cliché de votre site web pris à un instant t. Une sauvegarde permet de restaurer votre site web tel qu’il était à cet instant du passé.
Pourquoi faire une sauvegarde de votre site web?
Après tout, si votre serveur est bien sécurisé, à quoi cela pourrait-il vous servir d’en faire une copie?
Faire une sauvegarde d’un site web, ça demande des ressources, de l’espace disque, ça fait quelque chose de plus à gérer …
Et c’est pourtant absolument essentiel.
C’est un atout essentiel en cas de:
- piratage
- bug
- fausse manipulation
- erreur humaine (vous avez effacé un article définitivement par erreur)
- problème de mises à jour
- défaillance du serveur web
- catastrophe naturelle, comme un incendie, une inondation ou un tremblement de terre
Une sauvegarde vous permet aussi de migrer facilement votre site web vers un autre serveur.
Bref, avoir une bonne politique de sauvegarde en place, c’est un peu comme avoir une bonne assurance. On espère ne jamais en avoir besoin, mais le jour où ça arrive, on est bien content d’avoir fait ça comme il faut.
Les différents types de sauvegarde
Il existe plusieurs types de sauvegardes, chacune ayant ses avantages et inconvénients.
La sauvegarde complète
Comme son nom l’indique, cette sauvegarde va copier l’intégralité des données de votre site vers la destination de votre choix. Tous les fichiers et la base de données sont ainsi clonés.
- avantages: cette sauvegarde seule permet de restaurer tout votre site, de le migrer, bref elle contient tout ce qu’il faut !
- inconvénients: cette sauvegarde peut peser très lourd et demander des ressources non négligeables au serveur lors de son exécution.
La sauvegarde incrémentielle
Cette sauvegarde ne va enregistrer que les changements qui ont eu lieu depuis la dernière sauvegarde, qu’elle soit complète ou incrémentielle. Par exemple, si vous avez effectué une sauvegarde complète le lundi, et lancez une sauvegarde incrémentielle le mardi, cette dernière ne contiendra que les changements que vous aurez fait au cours des dernières 24h.
- avantages: bien plus légère et rapide à mettre en place
- inconvénients: paramétrage un peu plus complexe, et demande pour être restaurée de bien posséder la dernière sauvegarde complète ainsi que toutes les sauvegardes incrémentielles intermédiaires
La sauvegarde différentielle
Cette sauvegarde reprend le principe de la sauvegarde incrémentielle mais va sauvegarder les changements qui ont eu lieu depuis la dernière sauvegarde complète uniquement. La première sauvegarde différentielle sera donc similaire à une sauvegarde incrémentielle, mais les suivantes continueront de se référer à la sauvegarde complète, comme si aucune sauvegarde intermédiaire n’avait été faite.
- avantages: plus simple à mettre en place que l’incrémentielle, et moins lourde qu’une sauvegarde complète
- inconvénients: plus lourde qu’une sauvegarde incrémentielle
L’importance de la redondance des données
Maintenant que nous avons compris l’importance de la sauvegarde des données (back-ups en anglais), abordons l’importance de sa redondance.
Définition
La redondance des données est un concept clé dans la gestion des informations, qui vise à garantir la disponibilité et la sécurité des données en créant des copies supplémentaires. Dans le contexte de la sauvegarde des sites web, la redondance joue un rôle crucial pour minimiser les risques de perte de données et assurer une récupération rapide en cas de problème.
Deux types de redondance
Je vous présente deux types de redondance:
La redondance locale
La sauvegarde est tout simplement effectuée au même emplacement physique. Typiquement, certains hébergeurs proposent des sauvegardes régulières dans leur forfaits, mais ces dernières sont parfois stockées dans le même centre de données.
Quand vous faîtes une sauvegarde de vos photos de vacances sur une clef usb que vous glissez dans le tiroir de votre bureau, c’est un peu la même chose.
On comprend vite le risque avec ce type de redondance : si le centre de données brûle (comme c’est malheureusement arrivé à OVH il y a quelques années), vous perdez tout.
La redondance géographique
Vous l’avez deviné, on va cette fois-ci s’assurer que les données sont stockées ailleurs. On évite ainsi les problèmes en cas d’incendie, d’inondation, ou d’autres catastrophes.
Bien entendu, la mise en place d’une sauvegarde distante demande un peu plus de paramétrages, mais est essentielle.
Combien de copies faut-il conserver?
On l’a vu, sans sauvegarde, en cas de problème irréparable, vous perdrez toutes vos données.
Avec une sauvegarde, qu’elle soit locale ou distante, vous vous assurez à 90% de pouvoir récupérer vos données.
Pourquoi 90% et non 100% ?
Parce qu’on l’a dit, la machine qui stocke votre sauvegarde pourrait bien elle aussi avoir un problème : catastrophe naturelle, défaillance matérielle, cyber attaque …. Mais aussi parce que le processus de création d’une sauvegarde n’est pas infaillible. On parle alors de sauvegarde corrompue.
Comme on a envie d’éviter de se retrouver dans les 10% restants, on va donc faire une sauvegarde de plus. Comme ça, on passe à 99% de chances de pouvoir restaurer son site web en cas de coup dur.
Et si comme moi vous vous dîtes que 1% c’est encore trop, vous pouvez cloner une nouvelle fois dans une autre localisation géographique vos sauvegardes afin de monter à 99,9% de tranquillité d’esprit 🙂
Oui parce que la probabilité que votre site web soit hacké, que le serveur de la première sauvegarde brûle, que celui de la seconde soit dévasté par un tsunami, et que la troisième sauvegarde soit corrompue… Le tout dans la même journée, est vraiment très très faible.
Quelle fréquence de sauvegarde choisir pour son site web?
La fréquence des sauvegardes est un élément important à réfléchir lors de la mise en place de la stratégie de sauvegarde de votre site web. En effet, une sauvegarde trop vieille ne sera peut-être pas suffisante pour résoudre votre problème, et pourrait même en créer de nouveaux.
Évaluation des besoins
Posez-vous les bonnes questions relative à la nature de votre site web. Un site web vitrine qui n’évolue pas souvent n’aura pas les mêmes besoins qu’un site ecommerce sur lequel des transaction sont réalisées toutes les heures.
Demandez-vous aussi ce que vous encourrez en cas de perte de données. Pour un site qui évolue peu, les pertes seront faibles si vous avez du restaurer votre site à sa version d’il y a une semaine, comparé à un site E-learning sur lequel les membres doivent savoir où ils et elles en sont dans leur progression quotidienne.
Recommandations de fréquences
Sauvegarde mensuelle
Pour les sites qui n’évoluent que rarement, typiquement les sites dits “vitrines”. On peut mettre en place une sauvegarde complète mensuelle avec une automatisation de sauvegardes incrémentielles journalières pour s’assurer de ne rien perdre en cas de restauration.
Sauvegarde hebdomadaire
Pour les sites qui vont changer un peu plus souvent, par exemple les sites avec fonctionnalité de blog. Passer à une sauvegarde complète chaque semaine permet d’avoir des “checkpoints” plus réguliers.
Sauvegarde quotidienne
Pour les blogs très actifs, les sites avec zone membres, les sites de vente en ligne, les plateformes elearning, etc. Bref pour les sites qui changent tous les jours. Une sauvegarde complète quotidienne est nécessaire.
Sauvegarde toutes les heures
On arrive à un niveau de sauvegarde très avancé, mais qui prend son sens pour du ecommerce. Dans ce cas là, on va ajouter en plus de la sauvegarde quotidienne une sauvegarde incrémentielle toutes les heures.
Quid du RGPD?
Dans les données que comportent vos sauvegardes se trouvent peut-être des informations très sensibles, comme des données personnelles sur vos utilisateur⋅trices.
Le Règlement Général sur la Protection des Données (RGPD) est une législation européenne qui vise à protéger la vie privée et les données personnelles des citoyens de l’Union européenne.
Implications pour les sauvegardes de sites web
Le RGPD vous impose d’obtenir le consentement de vos utilisateurs⋅trices à récupérer les données personnelles stockées dans vos sauvegardes. Normalement, vous avez déjà ce consentement en place puisque ce sont les mêmes données que celles stockées sur le serveur qui héberge votre site web.
Une autre contrainte est de ne conserver que les données nécessaires à vos activités.
Enfin, les données doivent être sécurisées, enfin de limiter autant que possible la fuite de ces données sensibles. Vous ne pouvez donc pas faire des copies et les stocker dans le cloud en accès libre. Ça paraît évident, mais ça vaut la peine d’être précisé, il en va également de la sécurité générale de votre site web.
Droit à l’effacement
Un critère important à respecter dans le RGPD est le droit des utilisateurs et utilisatrices à effacer les données en ligne les concernant. Pour les sites avec espace membre, il est primordial de proposer une option de suppression du compte et des données personnelles dans l’espace membre. Si ce n’est pas mis en place, votre politique de confidentialité doit préciser le moyen de vous contacter (par email par exemple) afin de procéder à cette demande.
Cela s’applique aussi aux sauvegardes bien entendu. Si vous n’en tenez pas compte et restaurez votre site à partir d’une sauvegarde effectuée afin la suppression d’un compte, celui-ci va ré-apparaître … Un peu problématique non?
Effacer un compte en particulier au sein d’une sauvegarde vous semble trop complexe ? Il vous suffit de créer une nouvelle sauvegarde complète après suppression du compte en question et d’éliminer les anciennes qui ne sont de fait plus utilisables.
Le choix de l’espace de stockage
Si vous choisissez d’effectuer la sauvegarde de votre site web vers un serveur situé par exemple aux États-Unis et appartenant à l’entreprise Alphabet (la maison mère de Google), bref si vous utilisez Google Drive, vous ne facilitez pas votre mise en conformité RGPD.
Les données y sont stockées en clair, en dehors de l’Europe, et soumises aux conditions d’utilisation que vous avez pleinement acceptées en créant votre compte Google.
Cette solution n’est donc pas un bon choix en terme de RGPD. Il en est de même avec beaucoup de solutions de stockage en ligne populaires.
Préférez les serveurs situées en Europe et dotées d’une bonne politique de confidentialité des données, chiffrés et sécurisés.
Ma stratégie de sauvegarde de sites web
Je vous présente maintenant la stratégie type que je mets en place pour tous mes clients dont je gère au quotidien les sites web.
Sauvegardes complètes quotidiennes
J’effectue automatiquement des sauvegardes complètes tous les jours, avec 30 sauvegardes de rétention.
Il s’agit de sauvegardes complètes, effectuées sur un serveur basé en Europe alimenté à 100% en énergies renouvelables.
Sauvegarde additionnelle
J’automatise une nouvelle sauvegarde en plus de la précédente en fonction des besoins du site. Pour un site qui évolue peu, une sauvegarde hebdomadaire sera suffisante par exemple.
J’utilise les sauvegardes incrémentielles dès que des changements plus fréquents sont opérés. Elles ont l’avantage de prendre peu de place et de ne conserver que le strict nécessaire. En ce qui concerne la base de données, elle est à chaque fois systématiquement sauvegardée dans son intégralité.
Cette deuxième sauvegarde est envoyée sur mon instance Nextcloud chiffrée, alimentée elle-aussi en énergies renouvelables.
La rétention de cette nouvelle sauvegarde dépend de sa fréquence, mais permet de restaurer un site encore plus loin dans le passé.
La dernière couche
En plus des deux copies précédentes, j’en effectue une dernière.
Mon instance Nextcloud est synchronisée avec mon ordinateur professionnel, alimenté aussi en énergies renouvelables chez EnerCoop, et lui aussi chiffré à la racine pour éviter toute possibilité de fuite de données en cas de vol.
Je dispose ainsi de 3 copies pour garantir à mes clients une restauration au plus proche si cela s’avère nécessaire.
Mes clients peuvent accéder à leur dossier de sauvegarde sur simple demande via un lien sécurisé.
La restauration de sauvegardes est incluse dans mes forfaits de gestion web, je leur évite ainsi d’avoir à gérer tout cet aspect technique !
Rollbacks
Enfin, lors des mises à jours WordPress, j’effectue ce qu’on appelle des rollbacks. Ce sont de simples sauvegardes de l’état d’une extension (ou d’une version de WordPress ou d’un thème) juste avant sa mise à jour. Il est ainsi facile de revenir en arrière simplement sans avoir à restaurer l’intégralité d’un site web, en cas de soucis suite à uns mise à jour.
Conclusion
Nous avons vu ensemble les points essentiels à aborder quand on met en place une politique de sauvegarde pour un site web.
Nous avons vu pourquoi c’est un sujet sérieux à ne pas négliger, et qu’une mauvaise stratégie de sauvegarde peut coûter très très cher à une entreprise en cas de problème.
J’espère que ces éléments vous ont aidé à mieux comprendre ce sujet complexe.
N’hésitez pas à me contacter si vous souhaitez échanger ou à consulter mes offres d’infogérance web si vous cherchez un professionnel à qui déléguer la sécurisation de votre site web professionnel.