Como extrair imagem do arquivo PDF

Question

Como extrair imagem do arquivo PDF

#1 resposta do (67 votos)
#2 resposta do (7 votos)
#3 resposta do (5 votos)
#4 resposta do (4 votos)
#5 resposta do (4 votos)
#6 resposta do (3 votos)
#7 resposta do (2 votos)
#8 resposta do (1 votos)
#9 resposta do (-1 votos)

46

Atualmente, uso o leitor de PDF da Foxit e baixei recentemente uma imagem da Internet, mas ela está em um arquivo PDF. Como faço para extrair essa imagem?

O sistema operacional é o Windows 7.

images pdf windows-7 extract processing

por studiohack 26.04.2010 / 15:54

9 respostas

67

Se você fizer o download do XPDF para Windows ( aqui ), você encontrará alguns arquivos .exe nele. Você pode executá-los sem "instalação". Use pdfimages.exe assim:

pdfimages.exe -help

Isso exibe a tela de ajuda.

pdfimages.exe ^
    -j ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

Isso extrai todos os JPEGs como prefixo-00N.jpg e todas as outras imagens como prefixo-00N.ppm (Portable PixMap).

[ Editar por ComFreek: Por favor, note a barra final no caminho de destino, o que é importante se você não quiser extrair todas as imagens em seu diretório pai.] -
{ Editar por KurtPfeifle: Eu não concordo com o comentário da ComFreek, mas deixo aos leitores para testar e descobrir as diferenças nos resultados em si. Meu parâmetro original, não usando uma barra final, como ..\prefix prefixará a imagem names usada para os arquivos extraídos.}

pdfimages.exe ^
    -j ^
    -f 11 ^
    -l 13 ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

O mesmo que antes, mas limita a extração de imagens às páginas 11 ('f' = first) a 13 ('l' = last).

Atualização:

Enquanto isso, prefiro a versão de pdfimages do Poppler - especialmente porque ele adquiriu esse novo recurso: adicione -list ao a linha de comando para listar (não extrair) as imagens contidas no PDF, além de algumas de suas propriedades. Exemplo:

pdfimages -list -f 7 -l 8  ct-magazin-14-2012.pdf

  page   num  type   width height color comp bpc  enc interp  object ID
  ---------------------------------------------------------------------
     7     0 image     581   838  rgb     3   8  jpeg   no        39  0
     7     1 image       4     4  rgb     3   8  image  no        40  0
     7     2 image     314   332  rgb     3   8  jpx    no        44  0
     7     3 image     358   430  rgb     3   8  jpx    no        45  0
     7     4 image       4     4  rgb     3   8  image  no        46  0
     7     5 image       4     4  rgb     3   8  image  no        47  0
     7     6 image       4     6  rgb     3   8  image  no        48  0
     7     7 image     596   462  rgb     3   8  jpx    no        49  0
     7     8 image       4     6  rgb     3   8  image  no        50  0
     7     9 image       4     4  rgb     3   8  image  no        51  0
     7    10 image       8    10  rgb     3   8  image  no        41  0
     7    11 image       6     6  rgb     3   8  image  no        42  0
     7    12 image     113    27  rgb     3   8  jpx    no        43  0
     8    13 image     582   839  gray    1   8  jpeg   no      2080  0
     8    14 image     344   364  gray    1   8  jpx    no      2079  0

Nota novamente: esta versão de pdfimages é a do Poppler (a do XPDF não não (ainda?) suporta este novo recurso), e o versão deve ser v0.20.2 ou mais recente.

por 29.07.2010 / 15:15

7

Você pode tentar importar o PDF para o Inkscape e trabalhar a partir daí. O Inkscape abrirá apenas uma página no momento, mas lhe dará controle total sobre o conteúdo da página. Você será capaz de extrair e manipular gráficos vetoriais do PDF com bastante facilidade.

No entanto, se você quiser extrair imagens raster do PDF, tenho certeza que pdfimages do XPDF é mais fácil (mas você ainda pode tentar usar o Inkscape depois de aprender como extrair imagens incorporadas de arquivos SVG ).

por 21.06.2011 / 07:26

5

Sem instalar nenhum software, você pode alternar para o PDF-XChange Viewer (selecione Portable Version ) que tem essa habilidade já embutida

exporta todas ou páginas selecionadas como imagem
formato de saída: PNG, JPG, TIFF, BMP
escolha DPI, nível de compactação, escala de cinza
pode salvar várias páginas como TIFF de várias páginas

^{cliqueparaampliar}

Porfavor,estejacientequeenquantoestemétodoconvertepáginasPDFinteirasemimagens,ométodoexplicadopelo@Laurenz usando o Sumatra PDF é superior se você quiser extrair imagens de uma página PDF com conteúdo misto (imagem + texto) para obter apenas a imagem.

por 11.02.2014 / 20:03

4

O Sumatra PDF é um leitor de PDF de código aberto rápido e leve que pode copiar imagens diretamente para a área de transferência, sem qualquer re-rasterização. / p>

por 02.09.2017 / 21:52

3

O MuPDF é um novo visualizador de PDF multiplataforma (desktop e móvel) (criado em 2006) lançado sob a licença AGPL . Ele é mantido pelas mesmas pessoas do Ghostscript .

Ele contém uma ferramenta de linha de comando para extrair imagens de um PDF:

mutool extract [options] file.pdf [object numbers]

The extract command can be used to extract images and font files from a PDF. If no object numbers are given on the command line, all images and fonts will be extracted.

-p password
       Use the specified password if the file is encrypted.

-r     Convert images to RGB when extracting them.

por 28.12.2015 / 18:34

2

use pdftocairo de poppler toolkit . Pode extrair e converter imagens de pdf para qualquer formato desejado. Ele sempre gera imagens e nunca gera ppm ou alguns dados assim. Seguinte comando encobrir as páginas em pdf para imagens jpg do mesmo:

pdftocairo.exe -jpeg "my.pdf" "my"

Você pode obtê-lo aqui para o Windows: link

Está disponível no Linux também.

por 13.12.2017 / 10:10

1

link é uma ferramenta online para extrair notas, destaques e imagens. Eu usei-o extensivamente na universidade para minha tese e fiquei muito satisfeito.

por 04.04.2014 / 11:31

-1

normalmente eu extraio a imagem incorporada com 'pdfimages' na resolução nativa, depois uso a conversão do ImageMagick para o formato necessário:

$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName   # save in .ppm format
$ convert fileName-000.ppm fileName-000.png

isso gera o melhor e menor arquivo de resultados.

Nota: Para imagens com JPG com perdas, você tinha que usar -j:

$ pdfimages -j fileName.pdf fileName   # save in .jpg format

Na pequena plataforma Win, você teve que baixar um binário recente (0.37, 2015) 'poppler-util' de: link

ATUALIZAÇÃO: No recente "poppler-util" 0.50+ (2016), o pdfunite tem uma opção "-all" para extrair o bitmap compactado sem perdas como .png e o bitmap compactado com perdas como .jpg, então é simples:

$ pdfimages -all fileName.pdf fileName

extraia sempre o melhor conteúdo de qualidade possível do PDF

por 11.11.2015 / 15:51

Tags images pdf windows-7 extract processing

Como eu verifico qual servidor DNS estou usando (no Mac OS X) Como definir o idioma padrão no Notepad ++

score 4 · Accepted Answer

A maneira mais rápida, se você não precisar de uma resolução de pixel original da imagem, é apenas pressionar os botões ALT e Print Screen. Em seguida, escolha colar onde você quiser a imagem.

A outra maneira de preservar a resolução é abrir o PDF em um programa de edição de imagem, como o Adobe Photoshop, e trabalhar com ele lá.