reduzindo o tamanho do arquivo PDF das imagens digitalizadas

1

Eu baixei este arquivo PDF de um site com 350 KB e 20 páginas. Todas as páginas são imagens digitalizadas. Eu extraí as imagens usando o Adobe Acrobat Pro, que são de tamanho 1,32 MB coletivamente (visualizar > ferramentas > processamento de documentos > exportar todas as imagens). Eu os converti em um único arquivo PDF (1,28 MB). Como posso combinar essas imagens em um arquivo PDF de tamanho reduzido?

Preciso reduzir o tamanho das imagens digitalizadas com um software? Então, como posso fazer isso para obter a qualidade do arquivo PDF de 350 KB?

Na verdade, eu regularmente escanear alguns dos meus documentos e convertê-los em PDF e quero mantê-los o menor possível.

O que eu tentei:

  • no Adobe Acrobat Pro: arquivo > salve como outros > PDF de tamanho reduzido
  • no Adobe Acrobat Pro: arquivo > print > caixa de seleção "imprimir em escala de cinza" marcada

atualização: links removidos devido a violação de direitos autorais.

    
por living being 28.12.2014 / 09:29

1 resposta

1

O que você fez é útil como um exercício. Caso contrário, exportar imagens de um PDF como este e criar um novo PDF a partir delas não faz sentido.

O uso do espaço do documento original é:

Description        Bytes      Percentage
Images             351,829    97.60 %
Content Streams    2,742      0.76 %
Document Overhead  5,916      1.64 %
Total              360,478    100 %

O uso do espaço do seu documento é:

Description        Bytes      Percentage
Images             1,329,944  98.87 %
Bookmarks          21         0.00 %
Content Streams    1,675      0.12 %
Structure info     60         0.00 %
Document Overhead  13,389     1.00 %
Total              1,345,089  100 % 

O documento original não é criado com o Acro, mas iText , o que explica as informações de estrutura ausentes.

Em Processamento de documentos, você tem uma ferramenta separada, "Otimizar PDF digitalizado". Segui seu fluxo de trabalho e executei o otimizador em meu PDF recém-criado, e o tamanho do arquivo resultante é de 328 KB. No entanto, a qualidade é claramente pior do que o documento original.

Isso é esperado, já que fiz tudo com configurações padrão. Isso significa que a exportação de imagens já foi feita como jpg que, de qualquer forma, é maior que um PDF. Eu testei isso apenas extraindo cada página para um único PDF - por exemplo, a imagem jpg exportada da página 1 é 22KB, enquanto exportada como um PDF é apenas 9KB. A otimização das imagens ainda mais no novo documento piora ainda mais a qualidade da imagem. Isso é inevitável com formatos de imagem de bitmap, como jpg.

O uso do tamanho acima mostra que o Acrobat exportou claramente as imagens com a melhor qualidade possível. Isso faz sentido, pois quando você faz isso, você quer tirá-los com perda mínima de dados de imagem.

Uma opção pode ser a OCR do arquivo, que converte as imagens em texto, e os arquivos de texto são muito mais claros do que os de imagem. O Acro Pro contém a ferramenta OCR, mas não posso testar isso, pois não tenho árabe disponível.

EDIT: O pacote de idiomas estendido só se aplica ao Adobe Reader. Depois de alguma pesquisa, parece que o Acrobat não suporta o OCR árabe. Veja esta discussão no fórum da Adobe .

Digitalizar para PDF e otimizar é sempre uma troca entre tamanho e qualidade. Você só precisa testar com configurações diferentes (digitalização original e otimização) para encontrar um compromisso satisfatório.

As instruções para otimização de PDF estão na Ajuda do Acrobat. A ajuda está disponível on-line para os dois Acrobat X e Acrobat XI

    
por 29.12.2014 / 00:25