Como verificar se uma deduplicação ocorreu?

4

O Microsoft Windows Server 2012 e versões posteriores oferecem um serviço de deduplicação que verifica periodicamente arquivos, localiza fragmentos idênticos e remove cópias excessivas para economizar espaço.

Para o usuário que está navegando nos arquivos, todos devem ter a mesma aparência.

Meu problema é que tenho um software que lê esses arquivos e falha quando lê um arquivo processado por desduplicação. Eu configurei um servidor windows com serviço de deduplicação para desenvolver e testar uma correção para isso, mas não tenho certeza se meus arquivos de teste estão sendo desduplicados e se minha correção está realmente funcionando.

Existe algo nos metadados do arquivo sobre qualquer deduplicação ocorrida? Ou talvez o serviço de eliminação de duplicação tenha uma base de dados acessível com os arquivos aumentados?

Já tentei o óbvio: criar um arquivo, copiar esse arquivo na mesma pasta e, em seguida, visualizar as propriedades da pasta - mas o tamanho da pasta equivale a ambos os arquivos, enquanto esperava que correspondesse ao tamanho de apenas um arquivo.

    
por DraxDomax 06.06.2018 / 19:23

2 respostas

3

A desduplicação é implementada como um driver de filtro sobre o NTFS (e agora o ReFS) e deve funcionar de maneira transparente. Você sempre pode desativá-lo para alguns conjuntos de arquivos específicos, se isso causar problemas.

Para obter o status de deduplicação, fique com o cmdlet Get-DedupeStatus. Veja:

link

Existe uma maneira de visualizar o que está lá. Veja:

link

Você pode excluir arquivos específicos de tarefas de deduplicação. Veja:

link

ExcludeFileType é o que você deve analisar.

ExcludeFileType Tipos de arquivos excluídos da otimização Matriz de extensões de arquivo Alguns tipos de arquivos, especialmente multimídia ou arquivos já compactados, não se beneficiam muito com a otimização. Esta configuração permite configurar quais tipos são excluídos.

    
por 10.06.2018 / 17:18
2

O funcionamento interno do serviço de dupe é armazenado em System Volume Information em cada volume, mas meu entendimento é que não há nada realmente legível lá para você, tanto quanto o que foi deduzido e o que não foi. Isso acontece no nível do bloco, não no nível do arquivo.

I have already tried the obvious: create a file, copy that file in the same folder and then view the properties of the folder - but the size of the folder amounts to both files, while I was expecting it to amount to the size of only one file.

A desduplicação ocorre em um cronograma. Se você copiar um arquivo e verificar imediatamente as propriedades, ele não terá sido desduplicado ainda. Você pode usar o Start-DedupJob para forçar uma otimização de desduplicação em um determinado volume para o seu cenário de teste.

    
por 06.06.2018 / 23:23