Implementação da estratégia de recuperação de desastres

2

Eu olhei um pouco em torno de outras questões, e nenhuma delas realmente respondeu o que eu precisava saber. Quais são os passos que devo dar para construir uma estratégia eficiente de recuperação de desastres, tanto para servidores quanto para estações de trabalho?

Aqui estou falando sobre como configurar backups, sistemas de fantasmas e coisas do tipo.

O que eu estou procurando é recommandations eu poderia passar para o meu chefe, idealmente com "graciosas barateamento" de soluções.

IE: Não podemos nos dar ao luxo de ter um substituto instalado rapidamente caso o nosso servidor falhe (como era o caso agora), e não tenha a possibilidade de manter peças sobressalentes no caso de a merda atingir o ventilador. Idealmente, eu sugeriria um poderoso RAID de hardware em dois controladores de domínio e, em seguida, opções menos dispendiosas e, em seguida, o mais barato disponível. Como está agora, estamos fazendo backups noturnos de uma unidade compartilhada para outra, e ela está conectada ao computador do meu colega de trabalho.

Tenho certeza que a opção mais barata seria a melhor, aos olhos do meu chefe, mas quero ter certeza de que ele entende como é importante obter o que precisamos para manter os servidores e as estações de trabalho funcionando.

    
por Olivier Tremblay 19.08.2009 / 16:52

4 respostas

4

Apenas para ser 10000% claro.

SEU SERVIDOR DEVE TER RAID também, O RAID NÃO É DE BACKUP .

Que está sendo coberto - o VMWare facilita a recuperação de desastres do servidor. Você pode fazer um script de captura instantânea e cópia de todos os VMDK do seu servidor (unidades virtuais) em outra estação de trabalho ou em um dispositivo de armazenamento conectado à rede barato. No caso do seu servidor ESX / ESXi travar, você pode rodar o ESXi em um laptop em uma pinça ou em um servidor barato. Não haveria reconfiguração, nenhuma recuperação, pouca configuração.

Na minha experiência de trabalho com clientes, as estações de trabalho geralmente morrem devido a problemas não-harddrive. Se uma fonte de energia morrer e fritar seu disco rígido, ele fritará ambos se você tiver RAID.

Minha recomendação para as estações de trabalho:

  1. Qualidade de compra, máquinas de classe empresarial (Dell Optiplex, e não a transação BestBuy do dia).
  2. Considere usá-los como fantasmas semanalmente em um disco rígido externo (?) ou use o Windows NTBackup para fazer backup de arquivos essenciais diariamente em um "servidor de backup".
  3. UPS's (marca de nome APC) em estações de trabalho críticas.
  4. Estações de trabalho sob garantia, de forma que as peças são entregues no dia seguinte (ou seja, Dell).

Minhas recomendações para servidores:

  1. RAID. Requeridos. A invasão de software parece funcionar tão bem quanto a invasão de hardware em muitos casos, se você não puder pagar a invasão de hardware.
  2. Backups. Toda noite. Em tempo real, se você puder pagar.
  3. VMWare ESXi.
  4. Backup de bateria da APC.

Um servidor de backup pode ser um PC antigo que você tem no escritório, um controlador SATA barato e 3 unidades de 1 TB no RAID5. O investimento total para backups de máquina em um servidor de backup com 2 TB de armazenamento deve ser < US $ 500.

Depois de ter um plano e uma implementação - TEST IT . Em seguida, agende os testes regularmente.

Com relação a ter hardware de reposição - em uma pequena amostra de máquinas, acho que você descobrirá que a falha é totalmente aleatória. Ter um disco rígido extra e uma fonte de alimentação pode nunca ser útil. Eu manteria uma estação de trabalho configurada sobressalente à mão, e apenas pediria peças da Newegg sob demanda, se necessário.

    
por 19.08.2009 / 18:18
2

O Capítulo 21 de "A Prática de Administração de Sistemas e Redes" fornece o tipo de detalhe que você realmente precisa para compreender os backups, especialmente a estratégia.

Tenha em mente: os backups não são apenas para quando seu servidor pega fogo, ou há uma falha no disco. E o RAID não é uma solução de backup, o RAID é uma solução de failover de hardware. Os backups estão disponíveis quando você ou seus usuários acidentalmente excluem arquivos que não deveriam ter. Backups são para quando algum software corrompe arquivos ou faz alterações que realmente não deveria ter. Os backups também são para fins de arquivamento, como para logs de concessões de DHCP para que quando a polícia bater e diga "Detectamos atividade ilegal X vindo do IP Y na data Z, 4 meses atrás. Quem tinha esse IP?" p>

Além disso, os backups não precisam necessariamente ser caros, mas, mesmo que sejam, eles valem 10 vezes mais quando você não os tem. Nosso servidor de backup usa hardware de consumidor barato, discos rígidos em vez de fita, e fica no local (no datacenter, que fica em um porão que aparentemente é avaliado na proximidade de uma explosão de bomba atômica).

    
por 19.08.2009 / 18:11
1

Recursos baratos / baratos (sem nenhuma ordem específica)

BOOK - Cópia de segurança & Recuperação (Soluções de Backup Econômico para Sistemas Abertos) link

Arranje um PLANO primeiro ... na verdade, pegue TRÊS ... depois fale com seu chefe e deixe-o "escolher" um.

Clonezilla - Maneira gratuita de fazer backup / imagem de uma unidade.

link

JungleDisk - Uma maneira barata (e fácil) de fazer backup de seus arquivos críticos fora do local.

link

Quanto ao hardware ... isso sempre será um problema. Se a sua fonte de alimentação morrer ... você precisa de uma nova. Se sua placa-mãe morrer ... você precisa de uma nova ... Se você ... tiver a ideia.

E tenho certeza que todo mundo vai gritar isso, mas lembre-se ... O RAID NÃO É UM BACKUP! : -)

Somente você (e seu chefe) poderão determinar se seu tempo de inatividade (e tempo de reconstrução) vale a pena ter um servidor de "warm standby" ou apenas algumas peças sobressalentes comuns.

Se você está realmente tentando manter as coisas baratas ... no mínimo, compre uma unidade USB de 1 TB por cerca de US $ 80 e use o clonezilla a cada

por 19.08.2009 / 18:19
-1

Tanto quanto eu me conheço, não precisaria de nenhuma ordem específica:

Para backup de dados
 - RAID de hardware
 - Replicação de Servidores
 - Backup fora do local, servido por terceiros ou caseiro

Para estabilidade do sistema
 - Backup do sistema (usando o Ghost ou um equivalente)
 Hardware uniforme na maior parte das estações de trabalho possíveis
 - Peças de reposição essenciais para o hardware com maior probabilidade de morrer mais cedo

    
por 19.08.2009 / 16:57