(supondo que você esteja se referindo ao uso de desduplicação no ZFS versus seu software de backup)
Eu não recomendo usar a desduplicação ZFS nativa para seu sistema de backup, a menos que você projete seu sistema de armazenamento especificamente para ele.
O uso da desduplicação no ZFS é extremamente intensivo em RAM. Como a deduplicação ocorre em tempo real à medida que os dados são transmitidos / gravados no conjunto de armazenamentos, há uma tabela mantida na memória que controla os blocos de dados. Esta é a tabela DDT . Se o seu servidor de armazenamento ZFS não tiver RAM suficiente para acomodar essa tabela, o desempenho sofrerá tremendamente. A Nexenta irá avisá-lo quando a mesa ultrapassar um certo limiar, mas aí já é tarde demais. Isso pode ser aumentado pelo uso de um dispositivo L2ARC (cache de leitura), mas muitos dos primeiros usuários do ZFS essa armadilha.
Veja:
ZFS - destruindo zvol desduplicado ou conjunto de dados bloqueia o servidor. Como se recuperar?
ZFS - Impacto da falha do dispositivo de cache L2ARC (Nexenta)
Quando digo que o requisito de RAM é alto para usar dedupe, eu estimaria as necessidades de RAM e L2ARC para o conjunto de dados que você está descrevendo em 64 GB + RAM e 200 GB + L2ARC. Isso não é um investimento menor. Manter muitos arquivos de sistema do Windows e documentos de imagem que não serão relidos irá preencher esse DDT muito rapidamente. A recompensa pode não valer o trabalho de engenharia que precisa ser adiantado.
Uma ideia melhor é usar a compactação no zpool, possivelmente aproveitando os recursos do gzip para os tipos de dados mais compactáveis. A desduplicação não valerá a pena, pois há um problema quando você precisa excluir os dados desduplicados (precisa fazer referência ao DDT).
Além disso, como você apresentará o armazenamento ao seu software de backup? Qual pacote de software de backup você usará? Nos ambientes Windows, apresento o ZFS como armazenamento em block para o Backup Exec sobre iSCSI. Eu nunca achei os recursos do ZFS CIFS robustos o suficiente e preferi as vantagens de um dispositivo formatado nativamente.
Além disso, aqui está um excelente recurso do ZFS para ideias de design. Coisas sobre o ZFS que ninguém lhe contou