Use pdfimages
pdfimages
é uma ferramenta de extração de imagens em PDF que salva as imagens em um arquivo PDF no formato PPM, PBM, JPEG ou JPEG 2000.
É parte do pacote poppler-utils
, que você precisará instalar.
Uso: pdfimages [options] <PDF-file> <image-root>
Exemplo: O seguinte extrai todas as imagens de um arquivo PDF, salvando-as no formato JPEG.
pdfimages -j in.pdf /tmp/out
Salvará as imagens do arquivo PDF in.pdf
nos arquivos /tmp/out-000.jpg
(ou /tmp/out-000.pbm
; veja abaixo), /tmp/out-001.jpg
, etc.
A página de manual do pdfimages explica:
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.