Como remover o OCR de um PDF?

11

Estou pesquisando no Google há algum tempo, mas não consigo encontrar uma resposta para minha pergunta.

Tenho camadas indesejadas de OCR em um documento que eu digitalizei recentemente com o Adobe Acrobat. Ele não foi corrigido corretamente, e eu quero redigir algumas informações, mas o OCR está fazendo com que as informações desejadas sejam apagadas. Eu converti os arquivos para TIFs, mas notei uma perda de qualidade (muito) significativa. Ouvi dizer que a impressão para outro PDF mantém o texto ou reduz a qualidade da imagem.

Agradeço qualquer ajuda para resolver este problema o mais rápido possível.

Obrigado.

    
por Sanoo 11.10.2014 / 08:32

5 respostas

3

No Acrobat Pro DC, o comando apropriado é "Remover informações ocultas", disponível nas ferramentas "Proteger" e "Redigitar".

Ao executar o comando, ele apenas procura as informações ocultas, mas não altera o documento. Você deve então informar ao Acrobat quais informações remover. Nesse caso, selecione "Texto oculto" no painel Resultados, clique no botão Remover e salve o documento alterado.

    
por 11.04.2017 / 06:11
1

Depois de muita experimentação, descobri que a impressão em Adobe PDF do Adobe Acrobat imprime o documento sem o OCR e sem perder a qualidade (uma imperceptível à primeira vista a resolução é perdida).

No entanto, muitos sites afirmam que isso não funciona. Eu também tentei as outras impressoras, como Foxit Reader e OneNote, mas a qualidade foi reduzida. JPEG também era o mesmo.

Tenha em mente que sua milhagem pode variar.

Nota: deixo este tópico marcado como não respondido na esperança de encontrar uma resposta melhor que a minha.

    
por 13.10.2014 / 08:06
1

No Acrobat Pro: use 'remover informações ocultas' (sob 'proteção'). Selecione tudo, execute, o OCR desapareceu

    
por 20.10.2016 / 17:55
1

No Acrobat X, em Proteção, há um botão Sanitize Document que remove TUDO, mas o que pode ser visto (incluindo a camada de texto OCR), convertendo o documento em um mapa de bits plano.

    
por 14.12.2017 / 09:49
0

(um ano atrás ...)

Se, como você diz, os documentos são digitalizados e não são impressos em PDF a partir do Word, por exemplo, você pode remover facilmente com o seu Adobe:

Selecione Documento, Examine Documento e agora você pode remover o texto oculto (OCR).

    
por 10.12.2015 / 11:50