A maneira mais eficiente de atualizar regularmente o disco de backup off-line?

3

Lamento se essa pergunta já tiver uma resposta em algum lugar, mas como ela é altamente específica, todas as minhas consultas de pesquisa retornaram perguntas / respostas padrão correspondentes ao tópico de backup em geral.

O que eu não peço:

  • Como fazer backup de dados
  • Como fazer backup do sistema
  • Ferramentas gerais de backup e seus recursos

Minha pergunta:

Qual é a maneira mais eficiente de fazer backup de todo um disco rígido, tendo várias partições, em um disco rígido idêntico (disco espelhado) que é mantido offline e ligado manualmente apenas para atualizar seu conteúdo?

Definição de eficiente para essa pergunta: menor implicação de desempenho no sistema (CPU, carga de E / S no disco rígido de origem), sem necessidade de interação manual (sem aplicativo de UI) e mecanismo confiável deseja corrigir erros de sincronização o tempo todo)

Minhas ideias:

Os comandos alternativos a seguir devem ser iniciados automaticamente, assim que o disco de espelhamento estiver ligado. Exibindo um progresso via e. g. a notificação na área de trabalho é pequena.

  • Execute rsync para cada partição
    • Prós:
      • Ferramenta padrão para tarefas como esta
      • Deve ser bastante eficiente
      • Suporta atualizações incrementais (sincronização)
    • Contras:
      • Tem que ser configurado para cada partição / atualizado nas alterações de partição
      • Sobrecarga de trabalho no nível do sistema de arquivos?
  • Executar comando ( dd ?) para o disco inteiro
    • Existe uma ferramenta no nível do disco que suporta diferenças de "sincronização" apenas para um disco de espelho?
    • As operações no nível do disco terão mais desempenho do que o rsync no nível do sistema de arquivos?
  • Use raid 1
    • Uma configuração de invasão 1 funcionará de maneira confiável se um dos discos estiver off-line na maior parte do tempo?
    • Existem efeitos colaterais indesejados da matriz de RAID 1 degradada permanente na operação normal?
    • O raid 1 é capaz de sincronizar diferenças de maneira eficiente (ou foi projetado para sincronizar com segurança)?
    • Pode haver problemas se as diferenças aumentarem demais?
    • Existem opções de raid 1 de hardware e software para o meu sistema - elas têm comportamentos diferentes em relação aos pontos acima e a esse caso de uso incomum em geral?
  • Existe outra opção?

À primeira vista, eu preferi a solução raid 1, porque o requisito de espelhamento de conteúdo é exatamente o que o raid 1s é feito. Mas como os arrays de raid servem para funcionar com dispositivos on-line e o caso de uso off-line (falha de dispositivo) deve ocorrer raramente, pergunto-me se essa solução é a abordagem mais eficiente para mim.

Atualização: características de partição / dados

Características de partição (que podem afetar as comparações de desempenho):

  • Uma partição conterá um sistema operacional linux (75 GB)
  • Uma é uma partição swap (que pode ser omitida na abordagem do sistema de arquivos; mas raramente é usada, portanto, isso não deve ser levado em consideração) (43 GB)
  • Uma partição é projetada para dados arbitrários (podem ser arquivos grandes, por exemplo, arquivos de disco de máquinas virtuais) (107 GB)
  • A partição principal (5,7 TB) é um contêiner criptografado luks
  • O sistema de arquivos é ext4 para todas as partições apropriadas

Atualização 2018-04-28:

Como se descobriu aqui que é uma questão não trivial comparar esses diferentes mecanismos, a melhor abordagem seria testá-lo e medir o desempenho.

Mas, entretanto, percebi que não há necessidade de um backup adicional de todas as partições, exceto da partição luks (não é necessário fazer backup da partição do sistema operacional, pois já é um backup do sistema operacional real em um SSD, não há necessidade de backup de swap, obviamente, e, finalmente, não há necessidade de backup da partição com dados arbitrários). Portanto, era fácil decidir usar a abordagem rsync, apenas para espelhar a partição luks. O espaço restante no "disco espelho" é definido agora como partição para backups manuais - e. g. para dados de sistemas estrangeiros, que é um "recurso" adicional valioso.

Lamento não ter analisado / respondido a pergunta original agora, porque tecnicamente é bastante interessante.

    
por Nicolas 18.03.2018 / 17:51

0 respostas