Converter um PDF digitalizado em um PDF compactado com imagem binária (2 níveis)

1

Tenho muitos PDFs digitalizados antigos que ocupam muito espaço no disco.

Eu experimentei muitos compressores PDF disponíveis na web. Todos eles me perguntam qual compactação usar para imagens coloridas e o que usar para imagens monocromáticas; mas não consegui encontrar nada para converter TUDO em uma imagem binária.

Por binário, quero dizer que cada pixel só pode ter um dos dois valores de cor: preto completo ou branco completo. Eu sei que todos os meus PDFs têm texto preto / branco (nem mesmo em escala de cinza). Alguma ferramenta (windows ou linux ou android) pode usar esse conhecimento para conseguir uma melhor compressão?

Não tenho certeza, mas a ferramenta "Otimizar PDF" no Adobe Acrobat Pro pode fazer o que eu quiser. No entanto, mesmo que isso aconteça, prefiro saber sobre uma aplicação menos dispendiosa e mais compacta.

    
por Abhishek Anand 06.04.2014 / 05:58

1 resposta

3

A compactação jbig2 é a melhor maneira de reduzir o tamanho do arquivo

Adam Langley escreveu o codificador jbig2enc originalmente para o googlebooks

e, em seguida, liberou o código-fonte para que qualquer pessoa possa criar

você pode também usar um binário pré-compilado de:

  • link
  • ou tente se compilação modificada (capaz de usar a opção -P, que você pode decidir qual quantidade de páginas por dicionário que você quer incluir, então o PDF resultante é mais ágil) Eu criei para o meu sistema funciona com o seu

Patch Jbig2enc + akrykukov

a sintaxe comum para jbig2enc é (assumindo que seus arquivos são tiff)

jbig2 -s -p -v *.tiff && pdf.py output >out.pdf

mas, para o patch Jbig2enc + akrykukov

jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf

IMPORTANTE:

você precisa de bibliotecas python para poder coletar e juntar todos os arquivos resultantes do jbig2 em um pdf

    
por 06.04.2014 / 15:26