zfs deduplication “baixa” relação

3

No Solaris 11, em um pool chamado mypool , desdupliquei ativada com

zfs set dedup=on mypool

Em seguida, criei dois arquivos de 100 MB: file1 e sua cópia file1copy . Apenas seus nomes são diferentes: seu conteúdo é o mesmo.

O ponto de montagem de mypool é /mypool . Se eu copiar os dois file1 e file1copy para /mypool , a saída de

zpool list mypool

indica uma proporção de DEDUP de apenas 1.34x . Por quê?

Depois, seguindo este guia, criei um sistema de arquivos

zfs create -o dedup=on -o mypool/archive

e, em seguida, os sistemas de arquivos de dois usuários mypool/archive/a e mypool/archive/b que herdaram a deduplicação do sistema de arquivos pai.

Se agora eu copiar file1 em mypool/archive/a e file1copy em mypool/archive/b , ainda haverá uma proporção DEDUP de 1.34x . Ele se torna 2 somente se eu colocar o arquivo mesmo , digamos file1 , em ambos mypool/archive/a e mypool/archive/b . Por quê?

Uma simples diferença de nome pode derrubar a deduplicação? A desduplicação não deveria atuar no nível de bloco?

1) Saída de zdb -S mypool

Simulated DDT histogram:

bucket              allocated                       referenced          
______   ______________________________   ______________________________
refcnt   blocks   LSIZE   PSIZE   DSIZE   blocks   LSIZE   PSIZE   DSIZE
------   ------   -----   -----   -----   ------   -----   -----   -----
     1    1.48K    189M    189M    189M    1.48K    189M    189M    189M
     2      800    100M    100M   99.9M    1.56K    200M    200M    200M
 Total    2.26K    289M    289M    288M    3.04K    389M    389M    388M

dedup = 1.35, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.35

2) Saída de zdb -b mypool

Traversing all blocks to verify nothing leaked ...

    No leaks (block sum matches space maps exactly)

    bp count:            3679
    bp logical:     410970112      avg: 111707
    bp physical:    408433664      avg: 111017     compression:   1.01
    bp allocated:   615948288      avg: 167422     compression:   0.67
    bp deduped:     157286400    ref>1:    800   deduplication:   1.26
    SPA allocated:  458661888     used: 76.47%

Nas pastas mypool/archive/a e mypool/archive/b , também havia outro arquivo.

    
por BowPark 04.09.2014 / 20:36

1 resposta

1

Nem todos os dados são "dedutíveis". Há um artigo aqui que explica este

    
por 05.09.2014 / 11:56