Supor compressibilidade de um arquivo grande

1

Eu tenho um arquivo grande (~ 20 GB) e quero fazer rapidamente uma estimativa (aproximada) de quão bem ele pode ser compactado. Procurando por um programa que possa fornecer uma estimativa imediata do tamanho do arquivo compactado e, possivelmente, aumentando a precisão da estimativa, quanto mais tempo for deixado para analisar os dados.

    
por wim 08.05.2012 / 09:06

2 respostas

2

Com a -v opção gzip imprime a taxa de compactação, então, como uma estimativa rápida e suja, você pode fazer algo assim:

$ dd if=myfile bs=1M count=100 2>/dev/null | gzip -v >/dev/null
 80.5%
$


É claro que, embora rápido e direto, apenas verificar a taxa de compactação dos primeiros x bytes (100 Mbytes neste exemplo) pode ser muito enganador se o conteúdo do arquivo não for uniforme.
Por exemplo, provavelmente não seria ótimo para uma imagem do sistema de arquivos.

    
por 02.04.2016 / 18:31
0

Sem examinar todos os dados, não há como saber como ele é compactável. Sinta-se à vontade para olhar para esta página para listas de ferramentas e velocidades de compressão, mas o que você está pedindo é basicamente impossível.

    
por 08.05.2012 / 09:25