Deduplicação de arquivos tar

3

Agora estou tentando configurar o ZFS com deduplicação no meu servidor de backup linux e fazer uma pergunta. Por exemplo, eu tenho 1k arquivos em backup1.tar e 1k mesmos arquivos e 1 novo em backup2.tar. Esses arquivos serão desduplicados ou não? Como posso ver, não funciona com arquivos tar. Talvez eu faça algo errado.

    
por cpt.Buggy 12.02.2013 / 15:48

2 respostas

6

É possível que alguns blocos dos tars sejam os mesmos, mas muito improváveis. O ZFS desduplica no nível do bloco (chamado de registro no ZFS), portanto, blocos individuais precisam ser idênticos. É garantido que os tars tenham execuções exatamente do mesmo conteúdo, mas se isso compor um bloco inteiro e ser alinhado por blocos é altamente improvável.

Se você quiser tirar proveito da dedução do ZFS para backups, use instantâneos e as funções de envio / recebimento. Isso tem a desvantagem normal de usar o espaço de folga (o armazenamento é alocado para arquivos em blocos de registros de gravação, se o arquivo não usa todo o bloco, há espaço restante que é desperdiçado). O Tar evita esse "problema", mas você precisa criar backups tar incrementais para recriar o efeito de deduplicação.

    
por 12.02.2013 / 15:58
3

A dedupe do ZFS é baseada em blocos, portanto, deve ser responsável pelo conteúdo do seu arquivo.

  • Qual é o tamanho do arquivo TAR?
  • Você já tem a compactação ativada?
  • Qual método você está usando para determinar a taxa de desduplicação? Os métodos padrão são: zpool status -D poolname ou zpool get dedupratio poolname
por 12.02.2013 / 15:54