Como posso desduplicar meus dados com o BTRFS?

11

Instalei o Lubuntu 15.04 no meu EEE PC 701 com o sistema de arquivos BTRFS. Quero desduplicar meus dados, mas não sei como.

    
por wb9688 03.06.2015 / 21:46

2 respostas

11

Comece fazendo um backup completo para que, caso algo dê errado, você não tenha perdido nada.

Eu acredito que você está procurando por duperemove -d

"O Duperemove é uma ferramenta simples para encontrar extensões duplicadas e submetê-las à deduplicação. Quando recebe uma lista de arquivos, ele agrupa seus conteúdos em blocos e os compara, encontrando e categorizando extensões correspondentes Quando recebe a opção -d, duperemove envia essas extensões para deduplicação usando o ioctl btrfs-extent-same.

Duperemove tem dois modos principais de operação, um dos quais é um subconjunto do outro.

Modo somente leitura / não deduplicação

Quando executado sem -d (o padrão), duperemove imprimirá uma ou mais tabelas de extensões correspondentes que ele determinou que seriam candidatos ideais para deduplicação. Como resultado, o modo somente leitura é útil para ver o que o duperemove faria quando executado com '-d'. A saída também pode ser usada por algum outro software para enviar as extensões para deduplicação posteriormente.

É importante observar que esse modo não imprime todas as instâncias de extensões correspondentes, apenas aquelas que seriam consideradas para deduplicação.

Geralmente, duperemove não se preocupa com a representação subjacente das extensões que processa. Alguns deles podem ser compactados, passar por E / S ou até mesmo serem desduplicados. No modo dedupe, o kernel manipula esses detalhes e, portanto, tentamos não replicar esse trabalho.

Modo de dedução

Isso funciona de maneira semelhante ao modo somente leitura com a exceção de que as extensões duplicadas encontradas em nossa etapa "ler, fazer hash e comparar" serão realmente enviadas para deduplicação. Uma estimativa do total de dados deduplicados será impressa após a conclusão da operação. Essa estimativa é calculada comparando a quantidade total de bytes compartilhados em cada arquivo antes e depois da desduplicação.

Veja a página man do duperemove para mais detalhes sobre a execução do duperemove. "

isso parece não aparecer no pacote btrfs-tools, mas há uma página do hub git para ele aqui. questões abertas e fechadas (também conhecidas como pulso) disponíveis aqui

Pacotes para todas as versões atualmente suportadas do Ubuntu podem ser encontradas em este PPA

Preciso reiterar que o backup é altamente recomendado . Veja: link

Fonte citada: link

página de manual: link

    
por Elder Geek 03.06.2015 / 22:19
3

Eu sempre usei bedup . É muito rápido e confiável. Esta ferramenta também é mencionada na página oficial do btrfs . Eu nunca usei duperemove (bedup é mais velho).

    
por Adam Ryczkowski 01.12.2015 / 11:24

Tags