O conteúdo dos PDFs (texto e imagens) provavelmente já está compactado - portanto, não há muito a ganhar tentando compactá-los novamente.
Quais configurações usar ao criar arquivos 7zip para obter máxima compactação? Estou compactando documentos PDF contendo imagens digitalizadas. Estou pensando em usar o LZMA2, mas não sei o que definir no tamanho do dicionário, tamanho da palavra, etc. Além disso, o LZMA ou o PPMd seriam opções melhores?
Eu preciso ter alguns arquivos transferidos (~ 200MiB) sobre a rede e as velocidades de upload são muito lentas, então eu quero compactar os dados o máximo possível. O tempo de CPU consumido não é muito importante.
EDITAR
Veja o que recebi depois de testar vários métodos de compactação:
O tamanho descomprimido foi: 25,462,686B
Meu processador é Intel Core 2 Due T8100 e tenho 4GiB de RAM.
A melhor compactação foi com o PeaZip usando o algoritmo PAQ8O. O tamanho do arquivo resultante foi de 19.994.325B. As configurações usadas foram o nível de compactação: máximo. Infelizmente, a velocidade de compressão foi de cerca de 5 KiB / s, então demorou mais de uma hora para compactar os dados.
Em seguida foi o compressor experimental PAQ9O. Usando, obtive 20,132,660B em aproximadamente 3 minutos de compressão. Infelizmente, o programa é apenas linha de comando, e não muitos outros programas usam esse algoritmo de compressão. Ele também usa em torno de 1.5GiB de RAM com configurações que eu usei (a -9 -c)
Depois disso foi 7-Zip 9.15 beta (2010-06-20) usando LZMA2. Usando isso, consegui 20.518.802B em cerca de 3 minutos. As configurações usadas foram tamanho de palavra 273, tamanho do dicionário 64MB e usei 2 threads para compactação.
Agora, voltemos à minha pergunta original: No meu caso, o tamanho do bloco sólido não produziu nenhum resultado perceptível. Aumentar o tamanho da palavra produziu alguns resultados. A diferença entre o maior número de palavras e o menor foi de 115.260B. Acredito que essas economias justificam os esforços necessários para fazer dois cliques necessários e alterar o tamanho das palavras.
Eu tentei usar outros algoritmos de compressão suportados pelo 7zip e pelo PeaZip e eles produzem arquivos em tamanhos de 19,8 MiB a 21,5 MiB.
No final, minha conclusão é que, ao compactar documentos PDF contendo principalmente imagens, o esforço necessário para usar algoritmos exóticos de compactação não é justificado. Compressão usando LZMA2 em 7zip produziu resultados bastante aceitáveis em menor quantidade de tempo.
Tente precomp - primeiro descompacta os dados já compactados dentro dos seus PDF's. Então o 7z pode fazer sua mágica em dados não compactados.
Tente também o nanozip, que eu verifiquei ser muito efetivo, mas muito eficiente (400kb / s nas rações de compressão dos algoritmos PAQ).
7za a -t7z -mx-9 -mfb=258 -mpass=15 filename.7z subdir
Ajuste a primeira palavra conforme necessário para o nome do seu executável de linha de comando e ajuste as partes depois de "-mpass = 15" para personalizar seu nome de arquivo e o que ele deve incluir.
Esta resposta não é específica para documentos PDF.
Isso usa LZMA, não PPM. Eu fiquei longe do PPM porque há muitas variações que não são compatíveis com outras variações. O LZMA parece ser mais estável, com compatibilidade mais suportada. Então, eu fiquei longe do PPM precisamente porque minha opinião era, como você disse, "o esforço necessário para usar algoritmos de compressão exóticos não se justifica".
A compactação lzma é a melhor, porque você pode criar um arquivo sfx ou um pacote msi com uma alta taxa de compactação. no seu caso, você não está compactando um arquivo grande, então o diffrence é bem pequeno, especialmente se o arquivo foi compactado como: mp3 ou png
tente ganhar é livre e dá uma taxa de compressão
Tags pdf compression 7-zip