Como restaurar o teste com recursos de teste limitados?

3

Como uma pequena organização com recursos limitados faz um teste de restauração de seu sistema de backup de dados?

O bajulador de "Teste seus backups!" parece irrealista quando confrontado com a realidade do que um teste de restauração em grande escala envolveria, sem afetar os sistemas principais.

Suponha que a organização não tenha dezenas de milhares de dólares em capacidade de servidor de reserva disponível apenas para alocar para um lançamento temporário de um ambiente de teste completo para verificar se os backups noturnos são restauráveis.

Existe uma maneira de justificar a compra de todo o hardware da linha principal uma segunda vez, apenas para fazer o teste de restauração anual, mas, do contrário, ele fica armazenado, desligado e sem uso?

Foi sugerido em outras discussões do Server Fault sobre o teste de restauração de mídia, para usar uma unidade de fita separada para confirmar que a mídia é utilizável em outro dispositivo.

Para um site pequeno com apenas alguns servidores e uma única unidade de fita de produção, parece difícil justificar a compra de uma unidade de fita LTO-7 adicional por milhares de dólares e licenciamento adicional para o software de backup, apenas para use-o para um processo de verificação de ambiente de teste / restauração de mídia de uma vez por ano e, em seguida, coloque-o em uma prateleira e não o use até o processo de teste do próximo ano.

    
por Dale Mahalko 10.12.2016 / 07:40

3 respostas

4

Você testa seus backups principalmente para testar seus procedimentos de restauração para que, quando estiver em situação de crise, saiba exatamente o que fazer e quando todos entrarem em pânico, você seja competente, confiante , calma e saberá exatamente o que fazer e aproximadamente quanto tempo a restauração levará, etc. etc., porque restaurar os backups é um evento de rotina.

A segunda coisa que você provavelmente desejará fazer é a integridade dos dados de teste , quando você restaurar seus dados críticos, a produção poderá ser retomada? Nada está corrompido ou incompleto?

Você pode e provavelmente deve testar as duas coisas uma pequena parte de cada vez. Somente depois de ter o básico, você deve tentar restaurar um datacenter inteiro.

Se você fizer backups de sistemas de arquivos e compartilhamentos de rede, por exemplo, um teste adequado seria restaurar um diretório específico em um local alternativo e comparar tamanhos de arquivo, hashes e permissões com o original.

A próxima vez que você precisar clonar um banco de dados para teste, em vez disso restaurará um banco de dados de produção a partir do backup.

Faça uma restauração do SO "bare-metal" em uma VM, se necessário.

Mas backups e restaurações são apenas um aspecto de uma estratégia de recuperação de desastre e plano de continuidade de negócios maiores.

O que sua empresa fará quando sua localização atual for perdida devido a desastres naturais (incêndios, inundações, furacões etc.)? Pode continuar a operar a partir de outros locais existentes, ou o seu é o único local, a empresa simplesmente falirá ou o dinheiro do seguro será usado para alugar escritórios / contêineres de emergência?

Essa foi a estratégia BCP há alguns anos em uma empresa: um contrato com a HP, ou talvez a IBM na época, para fornecer um datacenter em um contêiner uma vez por ano para testes completos de recuperação de desastre e ter isso em espera bem como em caso de desastres agudos.

Essa empresa tinha 1 escritório e apenas fitas fora do local (ou talvez um robô de fita) e tudo mais internamente. A idéia era que alugar um espaço de escritório temporário e mobiliado, obter conectividade com a Internet e reencaminhar os números de telefone, obter desktops e impressoras, etc., seria na maior parte conveniente e fácil de organizar. Mas TI um pouco menos. Os cálculos de custo-benefício de um datacenter duplo eram desfavoráveis.

Portanto, inicialmente a cada 6 meses, mas depois uma vez por ano, eles fizeram um teste BCP completo, mas em hardware alugado temporariamente: implantando o VMWare, restaurando o servidor de backup, restaurando VMs com controladores de domínio do AD, servidores de email, banco de dados & servidores de aplicativos e compartilhamentos de arquivos.

Uma estratégia BCP mais contemporânea pode ser baseada na nuvem e com uma cópia de backup off-line on-line e você também pode testar sua restauração de DR na nuvem, se precisar de alguns dias até um número bastante grande de VMs não vai quebrar o banco.

    
por 10.12.2016 / 11:52
2

Parafraseando um velho ditado

disaster is certain, restore - not quite

Em suma, os testes de restauração de backup e são necessidades absolutas. Para ter um bom plano de backup e restauração, gostaria de enfatizar os seguintes pontos:

  • seja claro ao comunicar à gerência que uma restauração periódica é uma necessidade real. Essa é a parte mais difícil, pois a gerência vê qualquer coisa que não tenha um benefício direto e imediato como algo supérfluo. A triste realidade é que seus dados estão em risco, e eles precisam entender que restaurações periódicas, embora com um custo associado, são um investimento que vale a pena.
  • , esforce-se muito para evitar os blobs binários proprietários para armazenar seus backups: eles dificilmente podem ser inspecionados e oferecem pouca ou nenhuma possibilidade de recuperação parcial. strongmente prefira o formato de arquivo aberto e inspecionável (como tar ) ou, melhor ainda, use rsync (ou ferramenta semelhante) para ter um backup em nível de sistema de arquivos de seus dados. Com essas ferramentas, você pode facilmente inspecionar seu backup e ter uma idéia geral se todos (ou a maioria) estão presentes / acessíveis ou não.
  • para restaurações rápidas, tente ter uma imagem binária (via instantâneo) de suas máquinas virtuais críticas. Isso tem a vantagem de ser imediatamente inspecionável simplesmente importando / iniciando-o em qualquer estação de trabalho equipada com software de virtualização compatível (atualmente toda a principal plataforma de virtualização tem versão de teste gratuita que se encaixa muito bem nesse tipo de restauração "barata")
  • para bancos de dados, use as ferramentas de despejo apropriadas e restaure-as dentro de uma máquina virtual, e peça a um único usuário que use o banco de dados restaurado e faça uma rápida inspeção para ver se o aplicativo funciona e se dados recentes (isto é: ontem) estão presentes
  • quando o procedimento de backup e restauração funciona, documente: quando algo der errado, você terá um plano operacional muito claro a seguir, que diminui o estresse e aumenta as chances de sucesso.

Para restaurações rápidas e econômicas, é essencial fazer amplo uso de máquinas virtuais temporárias, executadas em hardware barato (leia-se: servidores ou estação de trabalho aposentados). Se o espaço em disco for um problema, faça um uso amplo de thin provisiong. Se a RAM disponível for o problema, restaure apenas um pequeno subconjunto de VMs (mesmo um único) a cada vez.

    
por 10.12.2016 / 14:16
1

For a small site with only a few servers and a single production tape drive, it seems hard to justify buying an additional LTO-7 tape drive for thousands of dollars and additional licensing for the backup software to go with it, just to use it for a once-per-year media restore / test environment verification process and then stick it on a shelf and don't use it until next year's test process.

A maioria das empresas não faz isso. A razão é que eles assumem que, no caso improvável de precisarem de um hardware de backup substituto, no caso de uma perda completa e catastrófica, podem comprar o hardware necessário e fazê-lo em questão de horas (por um preço). Portanto, o seu plano não precisa necessariamente incluir a compra de hardware de backup de reserva, software, licenças, etc.

    
por 10.12.2016 / 16:35