Existe xpdf que inclui o pdftotext
binário.
Pdftotext converts Portable Document Format (PDF) files to plain text.
No Linux, há um instalador disponível. Parece que também vem no pacote poppler-utils
. No OS X, você pode instalá-lo usando Homebrew (instale o primeiro) e, em seguida, use
brew install homebrew/x11/xpdf
que irá baixar os arquivos fonte e compilá-lo para o OS X. Depois disso, basta usá-lo como:
pdftotext your_pdf_file.pdf
que irá gerar um arquivo de texto simples. Também há algumas opções, confira man pdftotext
para mais detalhes.
Uma alternativa é o poppler , no OSX:
brew install poppler
no Debian e amigos
apt-get install poppler-utils