Práticas recomendadas para backup em um sistema de grade massivamente paralela

1

Eu trabalho no grupo de pesquisa de uma grande empresa. Fazemos muito trabalho em um sistema de processamento de grade com muitos nós (mais de 200, não sei exatamente quantos) e vários discos rígidos. Mais de 1000 TB de dados.

A maioria desses dados pode ser reproduzida, mas isso requer tempo. Muitos dos dados são códigos que são armazenados em repositórios RCS separados, que podem ter seu próprio backup, mas as cópias de trabalho são, obviamente, nas unidades de usuário normais.

Alguém pode me indicar um documento de práticas recomendadas ou algo sobre como a maioria das empresas protege esses dados?

Obrigado

    
por Brian Postow 20.06.2012 / 18:22

1 resposta

3

  1. Contrate um administrador ou engenheiro de backup.
  2. Dê a ele suas necessidades e orçamento. (isso pode ser um processo iterativo).
  3. Faça o que ele ou ela diz.

Há muito a projetar um sistema de backup eficaz para suas necessidades de negócios. Você pode fazer um instantâneo dos dados para outros discos e, em seguida, espelhar para fora do site (se tiver outro site) ou enviar para fita, ou simplesmente enviar para fita diretamente de seus nós. Pode haver problemas de simultaneidade de dados armazenados em backups em momentos diferentes - talvez seu aplicativo precise exportar ou desativar primeiro o quiesce? Nós não sabemos, você não nos contou. Há muitas questões e problemas técnicos.

E a primeira coisa que precisa ser abordada são suas necessidades reais de negócios - qual é o seu RTO (quanto tempo você pode ficar inativo até que seus dados sejam restaurados) e RPO (quantos dados você pode perder entre as execuções de backup)? Isso precisa ser parte de um DR ou plano de continuidade de negócios, ou se o prédio queima, você simplesmente não se importa mais com seus dados?

    
por 20.06.2012 / 19:10