Como pesquisar em PDFs usando expressões regulares?

11

Normalmente eu uso o Notepad ++ para pesquisar arquivos usando expressões regulares. Hoje eu estou querendo saber se existe um programa PDF que faz o mesmo para PDFs. Claro que eu poderia converter o PDF para texto e usar o Notepad ++, mas existe uma maneira mais fácil sem converter?

    
por Michael S. 15.03.2012 / 06:35

2 respostas

7

várias opções:

por 15.03.2012 / 07:23
4
  1. O Agent Ransack é gratuito (lite) e suporta PDF conforme confirmado pelas notas da versão.
  2. O PowerGREP é um produto comercial.

Assim como você disse, a alternativa evidente é converter PDFs em texto. Uma maneira de um programador configurá-lo para processamento em massa é usando o pacote PDFMiner do Python. O Agent Ransack usa "pdftotext" do projeto Xpdf (e você também pode).

    
por 15.03.2012 / 07:23