OCR e texto da camada em pdf

1

Eu quero OCR A pdf para torná-lo pesquisável.

Suppose you have a PDF document that was made using a scanner, or otherwise consists of image data but doesn't have text data. Such a PDF can't be searched by PDF readers or desktop search applications. pdfocr is a simple utility I made that takes a PDF file, then generates a new one that has the text layer added, so it's searchable by your PDF reader and can be indexed by your desktop search application, but is still identical when printed.

A partir Tutorial: Faça PDFs digitalizados pesquisável (OCR) usando pdfocr

currenly, software janelas como FreeOCR só faz um arquivo TXT para fora do pdf, mas eu quero que pdf original só que é pesquisável .

    
por user1603548 17.07.2014 / 22:07

1 resposta

1

O Adobe Acrobat tem a funcionalidade que você se refere. No Acrobat 10/11, a funcionalidade está na seção "Reconhecer texto" das ferramentas (consulte documentação oficial ). A mesma funcionalidade estava disponível em versões mais antigas, mas foi acessada de forma ligeiramente diferente (consulte o blog da Adobe ) .

Você pode executar o OCR em uma ou todas as páginas individualmente e o PDF parecerá idêntico após aplicar o OCR (mas é pesquisável).

    
por 17.07.2014 / 22:25