ferramenta de linha de comando para extrair imagens em massa de um pdf? [duplicado]

8

Eu tenho um catálogo em pdf que me foi fornecido por um cliente em formato pdf. Eles não têm as imagens, mas estão no pdf.

Existe uma maneira de extrair todas as imagens de um pdf usando uma ferramenta de linha de comando enquanto preserva seus nomes de arquivos originais?

Eu revisei este tópico ( Extrair imagens do PDF com máscaras de camada ) mas isso é para imagens individuais.

    
por chrisjlee 29.03.2012 / 22:17

1 resposta

11

O programa pdfimages do pacote poppler-utils pode ser o que você está procurando. Na página do manual:

  

Pdfimages lê o arquivo PDF do arquivo PDF, digitaliza uma ou mais páginas e          grava um arquivo PPM, PBM ou JPEG para cada imagem.

Nas versões mais recentes do poppler-utils existe um all mude para extrair para jpg ou png:

pdfimages -all input.pdf images/prefix

irá mostrar os arquivos no formato prefix-nnn. [png | jpg] na pasta images .

    
por Marco 04.06.2012 / 18:03

Tags