Se você fizer o download do XPDF para Windows ( aqui ), você encontrará alguns arquivos .exe nele. Você pode executá-los sem "instalação". Use pdfimages.exe
assim:
pdfimages.exe -help
Isso exibe a tela de ajuda.
pdfimages.exe ^
-j ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Isso extrai todos os JPEGs como prefixo-00N.jpg e todas as outras imagens como prefixo-00N.ppm (Portable PixMap).
[ Editar por ComFreek: Por favor, note a barra final no caminho de destino, o que é importante se você não quiser extrair todas as imagens em seu diretório pai.] -
{ Editar por KurtPfeifle: Eu não concordo com o comentário da ComFreek, mas deixo aos leitores para testar e descobrir as diferenças nos resultados em si. Meu parâmetro original, não usando uma barra final, como ..\prefix
prefixará a imagem names usada para os arquivos extraídos.}
pdfimages.exe ^
-j ^
-f 11 ^
-l 13 ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
O mesmo que antes, mas limita a extração de imagens às páginas 11 ('f' = first) a 13 ('l' = last).
Atualização:
Enquanto isso, prefiro a versão de pdfimages
do Poppler - especialmente porque ele adquiriu esse novo recurso: adicione -list
ao a linha de comando para listar (não extrair) as imagens contidas no PDF, além de algumas de suas propriedades. Exemplo:
pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf
page num type width height color comp bpc enc interp object ID
---------------------------------------------------------------------
7 0 image 581 838 rgb 3 8 jpeg no 39 0
7 1 image 4 4 rgb 3 8 image no 40 0
7 2 image 314 332 rgb 3 8 jpx no 44 0
7 3 image 358 430 rgb 3 8 jpx no 45 0
7 4 image 4 4 rgb 3 8 image no 46 0
7 5 image 4 4 rgb 3 8 image no 47 0
7 6 image 4 6 rgb 3 8 image no 48 0
7 7 image 596 462 rgb 3 8 jpx no 49 0
7 8 image 4 6 rgb 3 8 image no 50 0
7 9 image 4 4 rgb 3 8 image no 51 0
7 10 image 8 10 rgb 3 8 image no 41 0
7 11 image 6 6 rgb 3 8 image no 42 0
7 12 image 113 27 rgb 3 8 jpx no 43 0
8 13 image 582 839 gray 1 8 jpeg no 2080 0
8 14 image 344 364 gray 1 8 jpx no 2079 0
Nota novamente: esta versão de pdfimages
é a do Poppler (a do XPDF não não (ainda?) suporta este novo recurso), e o versão deve ser v0.20.2 ou mais recente.