É um cenário que toda equipe de TI teme. Você faz backups de servidores críticos com toda a dedicação para o seu dispositivo local ou para a nuvem, mas, quando ocorre um incidente e você mais precisa deles, a recuperação do backup falha.

Vamos ver por que a recuperação de desastres falha e como você pode evitar os fatores que levam a essa falha:

1. Falha em identificar e compreender as dependências de recuperação

Os planos de recuperação de desastres geralmente incluem estratégias de backup e retenção de dados que não mapeiam de forma completa as dependências e os requisitos necessários para uma recuperação de desastres sem complicações. A falta de alinhamento entre os planos de backup e as expectativas específicas de restauração pode ter consequências devastadoras.

A restauração das operações do servidor é apenas o começo

Para operações comerciais executadas em aplicativos de múltiplas camadas ou N-tier, não basta simplesmente restaurar o funcionamento do servidor. Nesses ambientes, as funções de processamento, gerenciamento de dados e apresentação podem estar hospedadas em máquinas diferentes, que precisam se comunicar entre si de maneira perfeita. Se você fizer backup desses componentes em horários diferentes ou restaurá-los com a ordem de inicialização errada ou em um host com uma rede virtual diferente, a comunicação entre eles poderá ser perdida. Como resultado, a recuperação de desastres falhará, os dados poderão ser perdidos e você poderá perder muitas horas tentando resolver os problemas.

Problemas de configuração

Problemas de configuração no ambiente de produção podem comprometer sua recuperação de desastres. Por exemplo, ao configurar ambientes de servidores virtuais como destinos de backup, é necessário alocar espaço para instantâneos, para que eles possam ser executados e salvos corretamente.

Dicas para identificar dependências críticas e garantir recuperações bem-sucedidas:

Reflita sobre diversos cenários de interrupção do serviço e analise as etapas específicas que você precisará seguir para restabelecer o serviço aos usuários finais. Examine cada etapa do processo em busca de possíveis dependências ou obstáculos à recuperação de desastres.
Documente as dependências críticas – ordem de inicialização, requisitos das aplicações, etc. – e incorpore-as nas etapas de recuperação.

2. Compreensão e prevenção de problemas de compatibilidade de software

Há uma ampla gama de problemas de compatibilidade de software que podem tornar os dados irrecuperáveis. O Serviço de Cópia de Sombra de Volume (VSS) da Microsoft é uma fonte comum de problemas de compatibilidade. No entanto, novas tecnologias de backup e recuperação de desastres na nuvem estão integrando software avançado de autocorreção para resolver esses problemas de compatibilidade. Essa tecnologia detecta automaticamente problemas de compatibilidade do VSS, configurações incorretas e uma ampla gama de ameaças à recuperabilidade. O software medeia conflitos do VSS, reinicia backups e executa uma variedade de outras etapas para corrigir problemas de backup antes que eles comprometam a recuperação, sem exigir qualquer intervenção da sua equipe de TI.

3. Testes inadequados

As equipes de TI continuam enfrentando dificuldades para encontrar tempo e recursos para realizar testes de recuperação de desastres com frequência suficiente para garantir que as recuperações ocorram conforme o planejado. No entanto, testar os backups é essencial para uma recuperação sem contratempos. Um plano sólido de recuperação de desastres deve evitar atalhos, como realizar testes apenas uma vez por ano (ou nem mesmo realizá-los), pré-carregar fitas nas bibliotecas de fitas, preparar servidores antecipadamente e substituir testes completos de restauração por verificações pontuais.

Dicas para aprimorar os testes:

Implemente soluções avançadas de backup e recuperação na nuvem que realizem automaticamente testes completos de recuperação do seu ambiente de backup.
Invista em soluções de backup e recuperação que testem automaticamente a capacidade de recuperação das aplicações e registrem o tempo real de recuperação em caso de desastre e o ponto de recuperação.

4. Falha na proteção contra corrupção de dados e malware

Existem inúmeras causas de corrupção dos dados de backup que podem levar ao fracasso das recuperações — desde a inversão de bits causada por erupções solares até quedas de energia inesperadas, passando por problemas no XFS e no sistema de arquivos, além de várias falhas de hardware (problemas com controladores RAID, controladores de armazenamento, corrupção do sistema de arquivos, falhas em NAS, etc.).

Apesar da crescente frequência de incidentes que ganham destaque na mídia, a falha na detecção de malware em ambientes de backup continua sendo um dos problemas mais comuns que causam falhas na recuperação de desastres. Os criadores de ransomware têm se tornado cada vez mais sofisticados, desenvolvendo programas que permanecem inativos por tempo suficiente para serem incluídos nos backups de dados, o que impossibilita a defesa contra ataques por meio de uma simples recuperação dos dados mais recentes.

Dicas para evitar a corrupção de dados e a infecção por malware em seus backups:

Escolha uma tecnologia de backup e recuperação baseada em Linux. A maioria das infecções por malware tem como alvo sistemas baseados em Windows.
Certifique-se de que sua tecnologia de backup e recuperação seja capaz de detectar sinais precoces de infecção por malware.
Utilize uma solução de backup e recuperação que inicie automaticamente e teste a capacidade de recuperação das aplicações em seu ambiente de backup, para garantir que você possa recuperar os dados com segurança usando backups não infectados, no caso de um ataque de ransomware (ou outro malware).
Certifique-se de que sua solução de backup inclua a verificação de redundância cíclica (CRC). O CRC é um código de detecção de erros utilizado para identificar alterações acidentais em blocos de dados que entram no seu sistema de backup, a fim de garantir que não haja corrupção de dados.

5. Falha ao seguir as práticas recomendadas de gerenciamento de mídia

Uma das razões mais comuns pelas quais um backup aparentemente perfeito não pode ser recuperado é o manuseio incorreto dos suportes de backup ou arquivamento – fitas, discos rígidos removíveis, etc. Embora as fitas e os discos removíveis sejam tecnologias relativamente simples, seu manuseio é altamente manual e exige o cumprimento rigoroso das melhores práticas. Erros humanos simples, como a identificação incorreta de fitas ou unidades de arquivamento, podem tornar impossível a recuperação a partir desses suportes.

Para um backup de dados eficiente, é possível automatizar todo o processo de gerenciamento de backup, replicação externa e retenção de longo prazo. Você também pode optar por utilizar a recuperação de desastres como serviço (DRaaS).

Os principais equipamentos atuais também vêm com hardware de autocorreção e monitoramento remoto que detectam sinais de alerta precoce de problemas de hardware e programam automaticamente a manutenção antes que ocorra uma falha real.

As infraestruturas de TI atuais são combinações cada vez mais complexas de ambientes locais, SaaS, em nuvem e virtuais. Para garantir um backup e uma recuperação eficientes, considere uma solução de backup que se integre à sua solução de gerenciamento de terminais. Monitore e gerencie todos os seus terminais, além de gerenciar implantações de antivírus/antimalware e backups, tudo a partir de um único console.

O Kaseya Unified Backup reúne os melhores serviços do mundo em backup, proteção contra ransomware, armazenamento em nuvem e continuidade de negócios e recuperação de desastres (BCDR) em uma plataforma poderosa e completa baseada em appliance. Para saber mais sobre o Kaseya Unified Backup, baixe aqui o resumo do produto.