Opção de desduplicação no Backup Exec 2010 - funciona assim?

1

Temos um sistema de backup em disco de 6 TB em execução com o Backup Exec 2010. A cada semana, um backup completo é realizado com diferenciais nos outros dias. Conseguimos obter cerca de quatro semanas de backups lá.

Primeiramente, estou certo em pensar que a opção de desduplicação seria mais eficiente usando esse espaço de backup em disco? Por exemplo, em cada uma dessas quatro semanas, o mesmo arquivo de 4 GB é recuado quatro vezes (espaço usado = 16 GB), mas com a desduplicação somente a primeira cópia seria armazenada?

Em segundo lugar, se você habilitar a desduplicação, isso terá um efeito imediato ou levará algum tempo para que a desduplicação percorra a área da B2D?

O primeiro exigiria que um trabalho fosse executado nos arquivos B2D existentes, localizando duplicatas e marcando o arquivo BKF como sobrescrevível.

O mais tarde seria muito mais fácil de implementar, já que ele apenas afeta os backups.

Se eu fosse um apostador, escolheria a opção posterior :-) Mais fácil de codificar ...

    
por Rob Nicholson 14.09.2010 / 12:25

2 respostas

2

Eu já instalei uma versão de teste do Backup Exec 2010 e posso responder minhas próprias perguntas:

Em primeiro lugar, não é possível usar um sistema de backup em disco existente e convertê-lo em armazenamento de deduplicação. A desduplicação é um mecanismo completamente diferente e é um novo tipo de armazenamento no BE. Você cria uma nova área de armazenamento de desduplicação de maneira semelhante à criação de uma área de armazenamento de backup em disco.

Portanto, minha pergunta sobre se desduplica uma pasta B2D existente é "não".

Isso nos dá o espinhoso problema de alternar para a dump do B2D se você estiver tentando usar a mesma mídia de armazenamento. Como o BE nunca exclui arquivos B2D BKF, você terá que fazer isso manualmente conforme a mídia expira.

Em segundo lugar, o DE-dup é baseado em blocos com 64k blocos por padrão. Além disso, é necessário manter o banco de dados de dicionário para permitir que ele bloqueie blocos duplicados. A estrutura de pastas de -dup é muito mais complexa que o B2D.

Em terceiro lugar, sim, o BE 2010 tem um grande requisito de RAM. Eu estava testando em uma VM W2k3 de 1 GB e notei que ela funcionava como um burro de três pernas. Ele estava consumindo 1,5 GB no total, então estava debatendo o arquivo de paginação. Portanto, acho que precisamos atualizar nosso servidor de backup ativo antes de considerarmos o uso de de-dup.

Felicidades, Rob.

    
por 20.09.2010 / 17:49
2

A configuração normal para usar o B2D em sistemas de armazenamento com desduplicação (ou o mecanismo de desduplicação do BE) é executar um backup completo e, em seguida, "incremental para sempre". Esse é o método preferido para utilizar a desduplicação em todo o seu potencial, mas pode não ser adequado para todos os datacenters existentes.

A desduplicação vem em muitos sabores. Não me lembro agora que um BE usa, mas todos eles criam somas de verificação de blocos de dados e então comparam-no a um banco de dados para ver se ele já foi armazenado em algum outro lugar.

O Backup Exec tem os requisitos de sistema bastante pesados para executar a deduplicação, você deve estar ciente disso. Se bem me lembro, é 1GB de RAM por 1TB de dados no ciclo de backup.

Você deve observar o efeito de deduplicação após o backup completo ter sido executado com a opção ativada. Isso será basicamente seus dados "básicos", conforme descrito acima, em que cada backup incremental será desduplicado em relação ao backup completo.

Não vejo necessidade de usar os arquivos B2D existentes. Por que não apenas apontar seu próximo backup completo para uma pasta no armazenamento B2D chamada "dedupe" ou algo assim?

    
por 14.09.2010 / 14:04