Dependendo do texto que você deseja extrair, pode ser melhor executar pdf2txt .
Eu tenho um pdf, que é enorme desde que foi exportado do photoshop e dificilmente posso abri-lo. Contém texto, eu gosto de copiar / colar.
Existe um comando para remover todas as imagens de um pdf e salvar o resultado como novo arquivo?
Entre. Eu já tentei pdftotext
, mas o arquivo resultante está confuso, a linha foi dividida em no máximo 10 caracteres, todo espaço em branco e assim por diante.
UPDATE
Eu encontrei um bom tópico aqui mas nenhum dos as soluções funcionaram, então eu acho que o "photoshop pdf" está realmente bagunçado ...
Dependendo do texto que você deseja extrair, pode ser melhor executar pdf2txt .