Soluções de backup off-site para 40 TB de dados / 35 milhões de arquivos na unidade única [fechada]

1

Eu tenho um servidor com 40 TB de dados e 35 milhões de arquivos. Enquanto o próprio servidor tem ataque e todo aquele jazz, eu estou preocupado com o que aconteceria se algo fisicamente destruir o servidor (fogo, raio, etc).

O sistema é projetado para executar tudo em uma única unidade (resmas de código legado), portanto segmentar em pequenos drives não é uma opção (os recursos necessários para reescrever o código são proibitivos).

Eu queria saber quais são as opções de backup off-site com custo efetivo. Movê-los para uma solução hospedada está na tabela, mas como muitos desses dados de mídia precisam ser processados com freqüência por um farm de servidores que podem apresentar problemas de latência e largura de banda.

edit: por "single drive" eu quero dizer do ponto de vista do usuário. Os dados em si podem ser distribuídos em uma unidade, desde que o software que acessa esses dados possa tratar tudo como uma única unidade.

    
por Jeff 27.09.2012 / 17:47

1 resposta

3

Como o Chopper disse, nós não fazemos recomendações de produtos e serviços - então tudo que eu vou lhe dizer é bem genérico. Você vai ter que ir ao seu armário de pensamento (possivelmente o seu canto de choro depois de ver algumas das etiquetas de preço) e descobrir como fazer isso acontecer em seu ambiente.

Se você estiver perguntando "Como faço para fazer backup desse servidor?", o que parece que você está tentando descobrir, comece definindo seus requisitos:

  • Quantos dados?
  • Com que frequência você precisa fazer o backup?
  • Com que frequência isso muda? (Quanto será em cada ciclo de backup?) Etc.

Saber isso ajudará você a descobrir qual solução pode ser mais eficaz. Provavelmente, você pode fazer o próprio backup com muitas ferramentas de backup comerciais (ou de código aberto), mas escolher a agenda de mídia e backup varia.

  • Muitas alterações de alto volume
    Você provavelmente é um candidato a uma replicação SAN e SAN (ou equivalente a um NAS). Basicamente, clonar todo o sistema de arquivos para outro site e transmitir as mudanças através de um link de rede dedicado.
    Note que este não é um "backup" real - se alguém excluir um arquivo importante, ele desaparece de ambos os locais - ele apenas fornece a recuperação de falhas.
  • Um grande conjunto inicial, mas baixo volume de alterações
    Um backup de base única e backups incrementais posteriores (possivelmente com backups de "consolidação" ou "sintéticos completos" para manter o tempo de restauração sob controle) podem funcionar bem aqui.

Escolher o tipo de mídia também é importante - As fitas são tradicionais e muito grandes.
Se o custo das fitas for proibitivo, as unidades de disco de terabyte também são relativamente baratas e confiáveis. A mídia óptica provavelmente não é uma opção com o tamanho do conjunto de dados de 40 TB.

A replicação de SAN em um link dedicado é uma ótima solução, além do custo. Outra opção é fazer o backup em uma SAN (ou apenas um host com uma tonelada de disco) em um site remoto, mas isso também exigiria uma conexão de rede dedicada (FAST). Isso é especialmente verdadeiro se o conjunto de alterações for grande (se você tiver um pequeno conjunto de alterações, sempre poderá fazer o backup inicial localmente e, em seguida, enviar o dispositivo de armazenamento para fora do local e aproveitar um link mais lento).

Além de fazer backup , certifique-se de levar em conta o processo de restauração - Se você levar 3 meses para obter seus dados de volta através de uma rede lenta uplink o backup pode não ser muito útil ...

    
por 27.09.2012 / 18:18