Acho que você estava no caminho certo com o Acrobat Pro.
Você precisa alterar a resolução real da imagem. Você pode fazer isso criando manualmente uma versão de baixa resolução (por exemplo, 50% W x 50% H) e substituindo a imagem existente no pdf pela nova. Nesse caso, o dpi da imagem dentro do pdf também precisaria ser reduzido para preservar o tamanho. Se você mantivesse o mesmo dpi, pareceria um quarto do tamanho.
Contanto que as dimensões do documento não mudem, o texto do OCR deve ser mapeado para as mesmas coordenadas espaciais.
Editar: processamento em lote usando o Acrobat Pro
Abaixo, você pode ver que o Acrobat Pro (XI) pode exibir as propriedades da imagem.
- Quandoumaimagemfazpartedeumpdf,obtémum" tamanho " físico no "papel virtual".
- O ppi (ou dpi, mas é mais para contextos de impressão) é uma métrica de pdf que fornece a relação entre o tamanho físico e o número de pixels. Eu acredito que a unidade pt / inch mostrada na imagem está incorreta; deve ser ppi. Eu também acho que chamá-lo de resolução é uma má escolha de palavras.
- A resolução de imagem real (width hight) é uma propriedade de imagem independente de PDF, afeta o tamanho do arquivo e o quanto você pode ampliar significativamente ao visualizar digitalmente.
Existe uma relação matemática simples: 2 = 3/1.
- O que você quer fazer é reduzir 3 mantendo 1 constante, desse modo implicitamente reduzindo 2 por uma quantidade correspondente.
- A maioria dos editores usa o texto "change dpi", que é efetivamente o mesmo: altere 2 e ajuste implicitamente 3 de modo que 1 permaneça o mesmo tamanho.
- Mas sob o capô a maior mudança ocorre com a resolução da imagem (3), o ppi / dpi é apenas um número que precisa ser atualizado no pdf; então eu acho meu texto melhor:)
Abaixo, você pode executar uma espécie de 'filtro inteligente' no seu pdf usando o Acrobat Pro, um dos filtros predefinidos disponíveis é a redução do dpi da imagem. Então você pode simplesmente executar essa opção de preflight ou criar a sua própria. Você pode ajustar as opções de downscaling e os métodos de compactação de imagem.
AchoquevocêpodeprocessarváriosarquivosPDFemloteusandoessemétodoemcombinaçãocomaferramenta"assistente de ação".