pdftohtml é provavelmente o que você está procurando.
Informações sobre o pacote: packages.ubuntu.com/lucid/pdftohtml
Estou procurando uma ferramenta que converta as páginas de um arquivo PDF em arquivos HTML. Eu só preciso do texto e formatação - não me importo com imagens e outras mídias.
pdftohtml é provavelmente o que você está procurando.
Informações sobre o pacote: packages.ubuntu.com/lucid/pdftohtml