Nem todos os dados são "dedutíveis". Há um artigo aqui que explica este
No Solaris 11, em um pool chamado mypool
, desdupliquei ativada com
zfs set dedup=on mypool
Em seguida, criei dois arquivos de 100 MB: file1
e sua cópia file1copy
. Apenas seus nomes são diferentes: seu conteúdo é o mesmo.
O ponto de montagem de mypool
é /mypool
. Se eu copiar os dois file1
e file1copy
para /mypool
, a saída de
zpool list mypool
indica uma proporção de DEDUP
de apenas 1.34x
. Por quê?
Depois, seguindo este guia, criei um sistema de arquivos
zfs create -o dedup=on -o mypool/archive
e, em seguida, os sistemas de arquivos de dois usuários mypool/archive/a
e mypool/archive/b
que herdaram a deduplicação do sistema de arquivos pai.
Se agora eu copiar file1
em mypool/archive/a
e file1copy
em mypool/archive/b
, ainda haverá uma proporção DEDUP
de 1.34x
. Ele se torna 2
somente se eu colocar o arquivo mesmo , digamos file1
, em ambos mypool/archive/a
e mypool/archive/b
. Por quê?
Uma simples diferença de nome pode derrubar a deduplicação? A desduplicação não deveria atuar no nível de bloco?
1) Saída de zdb -S mypool
Simulated DDT histogram:
bucket allocated referenced
______ ______________________________ ______________________________
refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE
------ ------ ----- ----- ----- ------ ----- ----- -----
1 1.48K 189M 189M 189M 1.48K 189M 189M 189M
2 800 100M 100M 99.9M 1.56K 200M 200M 200M
Total 2.26K 289M 289M 288M 3.04K 389M 389M 388M
dedup = 1.35, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.35
2) Saída de zdb -b mypool
Traversing all blocks to verify nothing leaked ...
No leaks (block sum matches space maps exactly)
bp count: 3679
bp logical: 410970112 avg: 111707
bp physical: 408433664 avg: 111017 compression: 1.01
bp allocated: 615948288 avg: 167422 compression: 0.67
bp deduped: 157286400 ref>1: 800 deduplication: 1.26
SPA allocated: 458661888 used: 76.47%
Nas pastas mypool/archive/a
e mypool/archive/b
, também havia outro arquivo.
Nem todos os dados são "dedutíveis". Há um artigo aqui que explica este
Tags backup zfs solaris filesystems