Tests de sauvegarde : pourquoi la plupart des entreprises découvrent trop tard que leurs sauvegardes ne fonctionnent pas

Selon le rapport Kaseya 2026 sur l'état du secteur des MSP, 79 % des MSP proposent désormais la sauvegarde et la restauration en tant que service géré. Cependant, proposer un service de sauvegarde et assurer une restauration vérifiée sont deux choses différentes, et l'écart entre les deux est plus important que ne le reconnaissent la plupart des MSP.

Les études sont sans appel. Alors que 92 % des entreprises affirment disposer de sauvegardes, 31 % d'entre elles ne parviennent pas à récupérer leurs données en cas d'attaque par ransomware. Plus de la moitié des entreprises testent leur plan de reprise après sinistre une fois par an, voire moins. Et 33 % ne le testent que rarement, voire jamais. Le problème ne réside pas dans la sauvegarde elle-même, mais dans le fait que son efficacité n'a jamais été vérifiée.

Une tâche de sauvegarde qui s'exécute sans erreur donne l'impression d'offrir une protection. Elle apparaît comme une protection sur tous les tableaux de bord et dans tous les rapports. La seule façon de savoir si elle offre réellement une protection est de procéder à une restauration à partir de celle-ci, et la plupart des entreprises ne le font que lorsqu'un incident catastrophique survient en production et qu'elles n'ont plus d'autre choix.

Ne vous demandez plus jamais si votre sauvegarde fonctionne

La fonctionnalité de vérification par capture d'écran de Datto BCDR lance et enregistre automatiquement chaque sauvegarde, vous fournissant ainsi une preuve visuelle de la possibilité de restauration après chaque tâche de sauvegarde, sans nécessiter de tests manuels fastidieux. Cette fonctionnalité s'appuie sur Kaseya Intelligence une précision supérieure à 99,9 %.

Pourquoi les sauvegardes échouent sans prévenir

Les défaillances de sauvegarde sont insidieuses précisément parce qu’elles sont invisibles. Aucune alerte, aucun rapport d’échec, aucun signe indiquant qu’il y a un problème, jusqu’à ce qu’on tente une restauration dans l’urgence.

Les tâches de sauvegarde s'achèvent, mais les restaurations échouent. Une tâche de sauvegarde peut indiquer qu'elle s'est déroulée avec succès, que les fichiers ont été transférés et qu'elle est terminée, tout en produisant une sauvegarde inutilisable. Parmi les échecs silencieux, on peut citer : des données d'application capturées dans un état incohérent qui ne peuvent pas être ouvertes après la restauration ; des erreurs de clé de chiffrement qui empêchent le déchiffrement ; des problèmes de droits d'accès aux fichiers qui bloquent l'accès à certains fichiers ; et des images de machines virtuelles qui ne parviennent pas à démarrer en raison d'incompatibilités au niveau des pilotes ou de l'abstraction matérielle.

Évolution de l'environnement. Les serveurs changent : les applications sont mises à jour, les configurations évoluent, de nouvelles sources de données sont ajoutées. Une configuration de sauvegarde qui était correcte il y a six mois peut ne plus permettre de capturer les données appropriées, ou présenter des problèmes de compatibilité avec les versions mises à jour des applications, qui n'apparaissent qu'au moment d'une tentative de restauration.

Lacunes en matière de conservation des données. Une attaque par ransomware à propagation lente peut avoir une durée de présence supérieure à votre période de conservation. Une sauvegarde conservant 30 jours d'historique peut ne pas offrir de protection contre une attaque qui a débuté il y a 45 jours et qui a déjà corrompu tous les points de restauration du jeu.

Pannes de stockage. Les défaillances des destinations de sauvegarde passent souvent inaperçues. Un disque sur site, une bibliothèque de bandes ou une destination de stockage dans le cloud qui serait indisponible depuis des semaines pourrait ne pas être détecté avant qu’on tente une restauration. À ce moment-là, la période de conservation pourrait déjà être dépassée.

Les conséquences ne se limitent pas à un échec de la restauration. Elles comprennent des temps d'arrêt prolongés, la perte irrémédiable de données, des négociations avec des auteurs de ransomware qui auraient pu être évitées et, dans le pire des cas, la faillite de l'entreprise. Près d'un propriétaire de PME sur cinq ayant subi une cyberattaque a fait faillite ou a dû cesser son activité. Des sauvegardes testées constituent la défense technique la plus efficace contre un tel scénario.

Comment fonctionnent les tests de sauvegarde : les cinq types de tests

Test de restauration au niveau des fichiers. Restaurez des fichiers spécifiques à partir de sauvegardes, de documents, d'exportations de bases de données et d'archives de courriels, puis vérifiez qu'ils s'ouvrent correctement et contiennent les données attendues. Il s'agit du test minimal requis, qui permet de détecter les corruptions au niveau des fichiers, les problèmes d'autorisations d'accès et les problèmes de chiffrement. Il peut être effectué fréquemment sans entraîner de charge opérationnelle significative.

Test de restauration au niveau du système. Restaurez un serveur complet ou une machine virtuelle à partir d'une sauvegarde dans un environnement de test isolé, puis vérifiez que le système démarre, que les applications s'ouvrent et que les services fonctionnent correctement. Ce test permet de vérifier si la restauration complète du serveur est réellement possible ; c'est aussi celui qui est le plus souvent négligé. Le fait de l'effectuer sur un réseau isolé évite tout impact sur l'environnement de production.

Test de restauration de la base de données. Pour les serveurs de bases de données, restaurez la sauvegarde de la base de données ainsi que les journaux de transactions, puis vérifiez que la base de données est cohérente, accessible et qu'elle correspond au point de restauration prévu. Les tests au niveau des fichiers ne permettent pas de détecter les problèmes spécifiques aux bases de données, tels que les incohérences dans les journaux de transactions, qui peuvent aboutir à une restauration techniquement réussie mais qui, dans la pratique, ne permet pas d'exécuter des requêtes.

Mesure du RTO. Chronométrez le processus de restauration, du début jusqu’à la confirmation de la récupération, et comparez ce temps au RTO défini pour ce système. Un serveur dont le RTO est de quatre heures et dont la restauration prend neuf heures présente un écart qui doit être comblé avant qu’un incident ne survienne, et non pendant celui-ci.

Simulation complète de reprise après sinistre. Exercice annuel ou semestriel consistant à traiter une fenêtre de maintenance désignée comme une situation de sinistre simulée : basculer tous les systèmes critiques vers l'infrastructure de secours, vérifier la continuité des opérations, mesurer les délais de reprise (RTO) réels, puis rétablir l'environnement de production. Il s'agit du test offrant le plus haut niveau de fiabilité et celui qui révèle les lacunes systémiques que les tests au niveau des composants ne permettent pas de détecter. Il comprend une simulation de reprise après sinistre avec le personnel clé pour identifier les lacunes, des exercices sur table pour valider les listes de contrôle, ainsi qu'un test complet de basculement où les opérations sont exécutées depuis l'environnement de reprise après sinistre avant le retour vers l'environnement de production.

À quelle fréquence faut-il faire un test ?

Recommandations concernant la fréquence par type de test et niveau du système :

Systèmes de niveau 1 (ceux dont les délais de reprise d'activité [RTO] sont les plus courts et dont l'impact sur l'activité est le plus important) : vérification mensuelle de la restauration au niveau des fichiers ; vérification trimestrielle de la restauration au niveau du système ; simulation annuelle complète de la reprise après sinistre.

Systèmes de niveau 2: restauration au niveau des fichiers tous les trimestres ; restauration au niveau du système deux fois par an ; incluses dans la simulation annuelle de reprise après sinistre.

Après tout changement important(déploiement de correctifs, mises à jour d'applications, modifications de l'infrastructure ou ajout de nouveaux systèmes au périmètre de sauvegarde), il convient de procéder à un test de restauration ciblé pour les systèmes concernés.

Après un incident de sécurité: même si l'infrastructure de sauvegarde n'a pas été directement touchée, testez la capacité de restauration avant de déclarer la reprise terminée. Les ransomwares ciblent spécifiquement les infrastructures de sauvegarde ; assurez-vous que vos points de restauration sont intacts.

Pour la plupart des MSP, le principal obstacle est le manque de temps. Effectuer manuellement des tests de restauration sur des dizaines d'environnements clients à la fréquence indiquée ci-dessus n'est pas viable sur le plan opérationnel sans automatisation. C'est là que la vérification automatisée comble cette lacune.

La règle du 3-2-1 et ce qu'elle ne prend pas en compte

La règle du « 3-2-1 », qui consiste à conserver trois copies des données sur deux types de supports différents, dont une hors site, reste la recommandation standard en matière d'architecture pour garantir la résilience des sauvegardes. Elle répond parfaitement au problème de la redondance : si une copie venait à être perdue, les autres resteraient intactes.

Ce qu'il ne prend pas en compte, c'est la possibilité de récupération. Trois copies de données corrompues, ce sont trois sauvegardes irrécupérables. Une copie hors site qui n'a pas été testée n'est qu'une hypothèse.

La règle du 3-2-1 doit être considérée comme une exigence minimale en matière d'architecture, et non comme la finalité d'une stratégie de sauvegarde. La finalité d'une stratégie de sauvegarde réside dans un processus de restauration testé, vérifié et chronométré, accompagné d'une documentation prouvant son efficacité.

Certaines recommandations font désormais référence à une variante « 3-2-2 », qui consiste à conserver deux copies hors site, l'une dans un autre lieu et l'autre dans un espace de stockage cloud immuable, afin de parer spécifiquement aux scénarios de ransomware où les sauvegardes sur site et la sauvegarde hors site principale pourraient toutes deux être compromises. Pour les environnements à haut risque ou les clients ayant des RPO très stricts, cette approche mérite d'être envisagée.

Automatisation de la vérification des sauvegardes

Les tests manuels ont leur utilité, mais ils ont leurs limites pratiques. Ils prennent beaucoup de temps, nécessitent des fenêtres de maintenance, ne couvrent qu’une partie des systèmes et sont effectués à des intervalles trop espacés, ce qui fait que la plupart des points de reprise ne sont pas validés entre deux tests.

Vérification par capture d'écran Datto démarre automatiquement chaque système sauvegardé dans un environnement de virtualisation isolé après chaque tâche de sauvegarde et capture une capture d'écran pour vérifier que le système démarre correctement. Cela permet une vérification continue, à chaque sauvegarde, de chaque système protégé, mettant en évidence les échecs de démarrage immédiatement après la tâche de sauvegarde plutôt que des semaines ou des mois plus tard lors d'une tentative de restauration. Optimisé par Kaseya Intelligence, il offre une précision supérieure à 99,9 % pour la vérification du démarrage.

Les contrôles d'intégrité des sauvegardes permettent de vérifier que les données sauvegardées sont intactes et ne sont pas corrompues, en signalant les divergences de somme de contrôle et les erreurs de stockage avant qu'elles n'entraînent une perte de données irrémédiable.

Les tableaux de bord de surveillance de l'état de santé regroupent les informations relatives à l'état des tâches de sauvegarde, à l'heure de la dernière sauvegarde réussie et aux résultats de vérification pour l'ensemble des systèmes protégés, offrant ainsi une visibilité opérationnelle qui permet une détection proactive et la génération de rapports pour les clients.

La combinaison d'une vérification automatisée et de tests de restauration manuels effectués à intervalles réguliers garantit à la fois une fiabilité constante et une capacité de reprise validée périodiquement.

Tests de sauvegarde et assurance cyber

Les assureurs spécialisés dans la cyberassurance exigent de plus en plus souvent la preuve que des tests de sauvegarde ont été effectués comme condition préalable à la couverture, et certaines polices précisent désormais explicitement la fréquence à laquelle ces tests doivent être réalisés. Une entreprise qui affirme disposer d'une protection par sauvegarde mais qui ne peut pas fournir la preuve que la capacité de restauration a été testée risque de voir ses demandes d'indemnisation liées à la perte de données ou à la restauration après une attaque par ransomware contestées.

Pour les MSP, cela représente à la fois une obligation de conformité et une opportunité commerciale. La documentation relative aux tests réguliers de sauvegarde, aux résultats des vérifications par capture d'écran et aux enregistrements de restaurations réussies correspond exactement au type de preuves que les assureurs souhaitent voir. Les MSP qui produisent systématiquement cette documentation aident leurs clients à satisfaire aux exigences des assureurs, renforcent leur propre position en matière de responsabilité et fournissent des éléments pour les revues trimestrielles (QBR) qui démontrent la valeur concrète de leurs services.

Une approche concrète pour les entretiens avec les clients : l'assurance cyber ne couvre pas les sauvegardes non testées, tout comme l'assurance automobile ne couvre pas un véhicule en mauvais état de marche. Le test en est la preuve.

Tests de sauvegarde pour les MSP

Pour les MSP, les tests de sauvegarde constituent à la fois une exigence opérationnelle, une obligation contractuelle, un atout en matière de communication avec les clients et une pratique de gestion des risques.

Obligation contractuelle. Les prestataires de services de gestion (MSP) proposant des services de sauvegarde assortis d'engagements précis en matière de RTO et de RPO doivent démontrer que leur infrastructure de sauvegarde est réellement en mesure de respecter ces engagements. Seuls des tests réguliers constituent une preuve tangible. Des accords de niveau de service (SLA) dépourvus de rapports de test ne sont que des promesses sans fondement.

Rapports destinés aux clients. Les résultats des tests de sauvegarde, les systèmes testés, les conclusions des tests, les délais de reprise d'activité (RTO) atteints et les captures d'écran de vérification constituent un contenu convaincant pour les réunions trimestrielles (QBR). Les clients qui constatent que les sauvegardes sont régulièrement vérifiées bénéficient d'un service que la plupart des MSP ne proposent pas, et qu'ils réclament de plus en plus à mesure que les exigences en matière de cyberassurance influencent leurs décisions d'achat.

Gestion des risques. Un MSP qui constate une défaillance de la sauvegarde lors d'un incident réel chez un client s'expose à des poursuites, à une atteinte à sa réputation, à une détérioration de la relation client et, éventuellement, à un litige contractuel. Des tests réguliers permettent de détecter les défaillances tant qu'elles peuvent encore être corrigées, plutôt que lors d'une crise.

Différenciation des services. La plupart des MSP proposent des services de sauvegarde. Mais rares sont ceux qui prouvent leur efficacité. Les MSP capables de démontrer la fiabilité de leurs solutions de restauration grâce à des tests systématiques et à une documentation rigoureuse disposent d'un argument de vente concret et vérifiable que les fournisseurs de solutions de sauvegarde standard ne peuvent égaler.

Découvrez la solution BCDR de Datto et la vérification automatisée des sauvegardes pour les MSP.

Le portail unifié de cyber-résilience

La gestion des sauvegardes sur les infrastructures sur site, les applications SaaS, les terminaux et les environnements cloud a toujours impliqué l'utilisation de plusieurs outils distincts, chacun doté de sa propre console, de son propre système d'alerte et de son propre processus de restauration. Pour les MSP qui gèrent plusieurs clients dans tous ces environnements, cette fragmentation engendre une charge opérationnelle importante et rend plus difficile le maintien d'une discipline de test cohérente.

Le portail Unified Cyber Resilience de Kaseya, lancé lors de l'événement Kaseya Connect 2026, regroupe l'ensemble de la gestion des sauvegardes au sein d'une interface unique et intégrée, mettant ainsi fin à la prolifération des outils qui oblige les techniciens à gérer la restauration entre différents fournisseurs disparates. Optimisé par Kaseya Intelligence, il offre une vérification des captures d'écran basée sur l'IA, des workflows de restauration interconnectés avec hiérarchisation intelligente, ainsi qu'une couverture de conformité incluant des fonctionnalités FIPS et la préparation à la certification FedRAMP. La prise en charge d'Azure Files est désormais disponible ; la sauvegarde Hyper-V sans agent sera disponible en juin 2026.

Pour les MSP, ce portail offre une vue d'ensemble unique de l'environnement de sauvegarde de chaque client, les résultats des vérifications et l'état de la restauration étant regroupés en un seul endroit, plutôt que dispersés sur les tableaux de bord de plusieurs fournisseurs.

Points clés à retenir

  • Bien que 92 % des entreprises affirment disposer de sauvegardes, 31 % d'entre elles ne parviennent pas à récupérer leurs données en cas d'attaque par ransomware. C'est précisément dans l'écart entre le simple fait de disposer d'une sauvegarde et celui de disposer d'une sauvegarde testée et opérationnelle que se situent la plupart des échecs de restauration.
  • Les tâches de sauvegarde peuvent indiquer qu'elles se sont déroulées avec succès tout en générant des points de restauration inutilisables. Les échecs silencieux, les dérives de l'environnement et les pannes de stockage restent invisibles jusqu'à ce qu'on tente une restauration.
  • La fréquence des tests doit correspondre au niveau de l'infrastructure : les systèmes de niveau 1 nécessitent une vérification mensuelle au niveau des fichiers, des restaurations trimestrielles au niveau du système et une simulation annuelle complète de la reprise après sinistre.
  • La règle du 3-2-1 porte sur l'architecture de sauvegarde, mais pas sur la capacité de restauration. Des processus de restauration testés et chronométrés viennent compléter cette stratégie.
  • La vérification automatisée (vérification par capture d'écran via Datto BCDR, optimisée par Kaseya Intelligence) permet une validation continue de chaque sauvegarde sans intervention manuelle, mettant en évidence les défaillances au moment de la sauvegarde plutôt qu'au moment de la restauration.
  • Pour les MSP, les tests de sauvegarde constituent une obligation contractuelle, une exigence en matière de preuve pour l'assurance cyber, ainsi que le facteur de différenciation le plus concret sur le marché de la sauvegarde.

Une plateforme complète pour la gestion informatique et de la sécurité

Kaseya 365 la solution tout-en-un pour la gestion, la sécurisation et l'automatisation de l'informatique. Grâce à des intégrations transparentes entre les fonctions informatiques essentielles, elle simplifie les opérations, renforce la sécurité et améliore l'efficacité.

Une seule plateforme. Tout l'informatique.

Kaseya 365 bénéficient des avantages des meilleurs outils de gestion informatique et de sécurité, le tout dans une solution unique.

Découvrez Kaseya 365

Votre succès est notre priorité absolue.

Partner First, c'est l'engagement d'offrir des conditions flexibles, un partage des risques et un accompagnement dédié à votre entreprise.

Découvrez Partner First Pledge »

Rapport Kaseya 2026 sur la situation des MSP

Kaseya - Rapport 2026 sur la situation des MSP - Image web - 1200 x 800 - MISE À JOUR

Découvrez les perspectives 2026 sur le MSP, issues des témoignages de plus de 1 000 prestataires, et apprenez comment augmenter votre chiffre d'affaires, vous adapter aux pressions du marché et rester compétitif.

Télécharger maintenant

Sauvegarde des serveurs : types, méthodes et élaboration d'une stratégie de sauvegarde

Server failures don’t announce themselves. A ransomware attack encrypts your data overnight. A failing drive corrupts a week’s worth of

Lire l'article de blog

Les meilleurs logiciels de sauvegarde de serveurs en 2026 : les meilleures solutions pour les MSP et les équipes informatiques

Comparez les meilleures solutions de sauvegarde de serveurs en 2026, classées pour les MSP et les équipes informatiques en fonction de la vitesse de restauration, de la protection contre les ransomwares et de la facilité de gestion.

Lire l'article de blog

La reprise après sinistre en tant que service (DRaaS) : de quoi s'agit-il et quand votre entreprise en a-t-elle besoin ?

Autrefois, la reprise après sinistre était coûteuse, complexe et réservée aux entreprises qui pouvaient justifier la mise en place d'un centre de données secondaire.

Lire l'article de blog