PDF para conversor de texto [fechado]

8

Eu estou procurando uma maneira de "um clique" de pegar qualquer PDF e convertê-lo em texto simples. Idealmente em OSX ou Linux.

Idealmente, a solução incluiria a funcionalidade de OCR, mas não necessariamente.

A principal prioridade é ter algo que possa receber QUALQUER arquivo SEM configuração.

    
por themirror 22.05.2011 / 08:55

2 respostas

23

Existe xpdf que inclui o pdftotext binário.

Pdftotext converts Portable Document Format (PDF) files to plain text.

No Linux, há um instalador disponível. Parece que também vem no pacote poppler-utils . No OS X, você pode instalá-lo usando Homebrew (instale o primeiro) e, em seguida, use

brew install homebrew/x11/xpdf

que irá baixar os arquivos fonte e compilá-lo para o OS X. Depois disso, basta usá-lo como:

pdftotext your_pdf_file.pdf

que irá gerar um arquivo de texto simples. Também há algumas opções, confira man pdftotext para mais detalhes.

Uma alternativa é o poppler , no OSX:

brew install poppler

no Debian e amigos

apt-get install poppler-utils
    
por 22.05.2011 / 10:43
0

Uma boa ferramenta para o Windows é o Extrator de Texto A-PDF

    
por 13.06.2012 / 16:12