Como posso portar uma camada de texto de um PDF para outro? (no windows)

2

Eu tenho alguns arquivos no formato .djvu, cujo tamanho é pequeno, mas infelizmente o mi e-reader não pode exibi-lo. Eu uso o DjvuToy para transformá-lo em PDF e ele mantém o tamanho pequeno; mas quando uso o Abby FineReader para fazer o OCR e salvar, o tamanho aumenta cerca de oito vezes (isso só acontece quando o arquivo inclui imagens coloridas ou em tons de cinza). Então, eu acho que seria possível pegar a segunda camada de texto do arquivo e adicioná-la à primeira para que eu pudesse obter tanto o tamanho pequeno quanto o OCR. Como posso fazer isso?

Nota: O arquivo djvu original não tem camada de texto, embora seja interessante saber como converter de djvu para pdf, incluindo texto diretamente.

    
por marlonob 04.10.2012 / 16:02

1 resposta

0

O Ghostscript pode ser usado diretamente para editar as propriedades do PDF, preservando a camada de texto:

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dColorConversionStrategy=/Gray -dProcessColorModel=/DeviceGray -sOutputFile=output.pdf input.pdf

De aqui .

    
por 06.10.2013 / 07:50

Tags