arquivos ZFS, dedupe e PST

4

Estou interessado em saber qual seria a taxa máxima de desduplicação esperada para um conjunto de arquivos PST.

Eu tenho ~ 40G de arquivos pst de ~ 15 usres com alto nível de duplicação de anexos. Estou executando testes para ver se posso economizar espaço significativa se armazenar os dados no ZFS com dedupe.

Para este propósito eu instalei uma configuração de teste do Nexenta, mas queria saber se alguém aqui já fez isso e qual o nível de desduplicação que eu poderia esperar (ou em outras palavras quão sensíveis são os arquivos pst para bloquear o alinhamento e quais são os parâmetros que podem influenciar a relação?).

O teste inicial mostra uma taxa de desduplicação muito baixa e eu encontrei explicação que a desduplicação em nível de bloco não seria eficiente aqui e aquele nível de byte dedupe seria muito melhor (e que deveria ser executado por aplicativo que está ciente da organização interna), então estou apenas checando aqui se alguém tiver mais alguma informação.

Caso contrário, provavelmente irei converter arquivos PST para o IMAP.

    
por Unreason 06.12.2010 / 10:29

1 resposta

5

Sim, os arquivos PST provavelmente não renderão as taxas de dedução que você está procurando. Os anexos dentro de um PST não ficarão alinhados e prontos para a desduplicação. Se você deseja maximizar as possibilidades de desduplicação com o ZFS, você precisará de um formato de armazenamento no qual os anexos sejam arquivos distintos.

    
por 07.12.2010 / 19:56

Tags