Solução de Backup Offsite - RAID com LVM para servidor GNU / Linux

1

Antecedentes

Olá, estou configurando um servidor Ubuntu GNU / Linux que combinará:
1) Software RAID1 (usando o mdadm) - Para fornecer proteção de dados contra falhas de hardware
2) Gerenciador de Volume Lógico (LVM) - Permitindo flexibilidade na organização dos meus dados e a capacidade de adicionar facilmente mais capacidade no futuro.

Até agora eu tenho sucesso:
1) Configure o RAID1 usando o mdadm e crie o / dev / md0
2) Configure o LVM tornando / dev / md0 um volume físico anexado a um grupo de volume chamado: vg_data. Eu tenho um Volume Lógico chamado: lv_shared montado em / home / shared:

NAME        FSTYPE LABEL UUID                                 MOUNTPOINT
sda
└─sda1      ext4         0xxxxxxx-2xxx-4xxx-8xxx-1xxxxxxxxxxx     /
sdb
└─sdb1     linux_raid_member ubuntu:0        02342342-2333-4444-8888-111111111111
  └─md0    LVM2_member                       57e241ad-aee3-4486-8eaa-222222222222
    └─vg_data-lv_shared ext4                 048b529c-2e39-4f49-83c9-333333333333    /home/shared
sdc
└─sdc1     linux_raid_member ubuntu:0        02342342-2333-4444-8888-111111111111
  └─md0    LVM2_member                       57e241ad-aee3-4486-8eaa-222222222222
    └─vg_data-lv_shared ext4                 048b529c-2e39-4f49-83c9-333333333333    /home/shared

Minha pergunta

Isso é bom se houver uma falha de hardware em um dos discos de dados, mas como faço para criar um backup externo? da configuração acima?
O backup deve ser capaz de restaurar completamente o sistema inteiro se algo der errado usando apenas o backup externo.

Depois de ler muitos tópicos sobre o assunto, encontrei as seguintes opções, mas como sou completamente novo nisso e quero perguntar e ver o que a comunidade recomendaria de sua experiência.
1) instantâneos LVM
2) Duplique uma das unidades RAID. EG: (onde sdd é meu disco físico de backup externo).

dd if=/dev/sdb of=/dev/sdd bs=64K conv=noerror,sync status=progress

Como seria o processo de recuperação para os métodos de backup acima?

Eu realmente estou presa a isso e quaisquer indicações / links para artigos / sugestões relevantes seriam muito apreciados, já que passei muito tempo tentando descobrir o que fazer, e minha zona de conforto está longe de ser vista.

Obrigado por ler a minha pergunta e espero que faça algum sentido para alguém!

Atualização 1:
Se eu usasse o rsync, não perderia o esquema de Gerenciamento de Volumes Lógicos. Um novo problema também surge se você imaginar que eu expandir a configuração acima para conter 3 pares de RAID1. Em seguida, adiciono esses para expandir a capacidade total do volume lógico. Eu precisaria rsync o ponto de montagem de volume lógico (para copiar todos os dados), que conteria 3 discos rígidos no valor de dados. Isso precisaria ser copiado para abranger várias unidades externas (já que não tenho uma única unidade com capacidade para todas as três unidades). Isso é possível usando o rsync. Quanto mais eu penso neste problema, a única solução que posso imaginar é criar um servidor de backup com a mesma configuração localizada externamente?

    
por GustavMahler 18.04.2017 / 23:39

2 respostas

1

Acho que você deve usar rsync para backup externo. Isso reduzirá o tráfego de backup diário. Salvar arquivos, não discos.

    
por 19.04.2017 / 17:42
1

O backup externo precisa ser eficiente na largura de banda, por isso, esqueça de usar dd bruto para copiar os discos / volumes para um local remoto. Além disso, geralmente não é necessário preservar o layout preciso da partição / volume lógico para backups remotos (leitura: lenta e última tentativa).

Vou tentar mostrar as várias possibilidades, ordenadas por eficiência:

  • use rsnapshot (baseado em rsync ) para copiar os dados para um local remoto, explorando hard-links (no lado remoto) para ter vários backups point-in-time. O primeiro backup levará algum tempo, mas os posteriores serão muito mais rápidos. Para preservar informações sobre partições / lvm, basta fazer backup da saída de lsblk; fdisk -l /dev/sdX; pvs; vgs; lvs
  • use a replicação geográfica de GlusterFS , que é novamente baseada em rsync
  • use despejo e / ou tar para fazer backups completos e incrementais / diferenciais, enviando-os para o local remoto via ssh
  • use bdsync ou blocksync para fazer backup dos discos de dados brutos em um local remoto. Preste atenção a) executar esses utilitários em um instantâneo do volume de origem eb) saber realmente como eles funcionam
  • use o proxy DRBD + DRBD para ter um servidor remoto sincronizado em bloco e em tempo real. Certifique-se de entender que a) O proxy DRBD é um complemento pago eb) isso não o protegerá de erros humanos / sabotagem, já que as alterações são enviadas imediatamente para o lado remoto (pense como um RAID1 de rede )

Em suma, não há uma bala de prata. No entanto, sugiro strongmente que você use a rota rsnapshot/rsync .

    
por 19.04.2017 / 19:26