Extraindo imagens incorporadas de um PDF

132

Antes de começar a usar o Ubuntu, usei o Nitro PDF Reader para extrair automaticamente imagens de arquivos PDF. Existe um leitor de PDF para Linux que faz isso?

Eu gostaria de poder extrair imagens mais rápido / mais fácil do que ao tirar uma foto instantânea.

    
por 1kb 13.06.2012 / 00:36

8 respostas

162

Use pdfimages

pdfimages é uma ferramenta de extração de imagens em PDF que salva as imagens em um arquivo PDF no formato PPM, PBM, JPEG ou JPEG 2000.

É parte do pacote poppler-utils , que você precisará instalar.

Uso: pdfimages [options] <PDF-file> <image-root>

Exemplo: O seguinte extrai todas as imagens de um arquivo PDF, salvando-as no formato JPEG.

pdfimages -j in.pdf /tmp/out

Salvará as imagens do arquivo PDF in.pdf nos arquivos /tmp/out-000.jpg (ou /tmp/out-000.pbm ; veja abaixo), /tmp/out-001.jpg , etc.

A página de manual do pdfimages explica:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
    
por pl1nk 13.06.2012 / 01:06
17

Costumo usar o Inkscape para isso. Carregue a página e exclua todas as outras coisas. A vantagem é que você pode obter imagens vetoriais em SVG e modificá-las como quiser.

    
por Gremlin 11.09.2014 / 15:12
4

Você também pode tentar o pdfmod. É uma GUI (interface gráfica) que pode extrair imagens e fazer outras manipulações básicas em pdf.

    
por To Do 13.06.2012 / 19:18
3

Eu tenho um arquivo PDF de coluna dupla com imagens incorporadas criadas com o LaTeX, onde as imagens originais eram fornecidas como EPS. Eu tentei a solução proposta com base em pdfimages , mas, infelizmente, ela não retornou nenhuma imagem. Eu tentei usar o Inkscape, mas as imagens SVG que ele gerava estavam distorcidas e eu também não tive a sorte de exportá-las como EPS.

O software que funcionou para nós foi o MasterPdfEditor .

Aqui está o procedimento

  • Abra seu arquivo usando o Master PDF Editor
  • Use a ferramenta de edição (Alt + 1) para selecionar a imagem que você precisa extrair
  • Copie a figura (Ctrl + C)
  • Clique na moldura tracejada ao redor da imagem e confira a barra lateral direita (Inspetor de objetos) e clique em "Geomerty". Lá você pode ver o tamanho da sua seleção
  • Crie um novo arquivo (Ctrl + N). Ele solicitará que você forneça o tamanho da página. Forneça o tamanho exato de sua imagem e crie o novo arquivo
  • Agora é um pouco complicado: cole a imagem (Ctrl + V). A imagem pode não aparecer no novo arquivo. Use as setas para movê-lo até conseguir rastreá-lo.
  • Use as setas para centralizar a imagem na nova página
  • Salvar como PDF

O resultado é de alta qualidade, mas o software não é gratuito. Há uma versão demo que "permite que você experimente todos os recursos", mas vem com "a adição de uma marca d'água no arquivo de saída". Para ser franco, não notei nenhuma marca d'água no PDF produzido.

    
por Pantelis Sopasakis 12.04.2016 / 18:50
2

Eu uso pdfimages, que é uma ferramenta de linha de comando e funciona muito bem para mim. É muito fácil de usar e você pode usar a opção --help para aprender mais sobre seu uso. Eu uso o Ubuntu e vem pré-instalado. Se seus arquivos pdf estiverem criptografados ou protegidos por senha, há opções para isso, portanto, essa ferramenta funciona muito bem. Você pode ler mais sobre o pdf aqui

    
por jetbird13 24.07.2013 / 03:39
1

Se você precisar de uma imagem recortada no formato pdf / eps, extraia uma página com a imagem usando pdfmod (como sugerido por To Do).

Em seguida, usando pdfcrop , você pode recortá-lo corretamente definindo margens por tentativa e erro:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
    
por macieksk 12.06.2014 / 16:17
1

Com imagens em pdf, a imagem extraída pode estar em duas ou mais partes. Uma maneira simples de reuni-los novamente sem se preocupar com os formatos extraídos é importar as peças para o LibreOffice Draw, cortar com a caixa de diálogo de corte de imagem, posicionar as partes, ajustar o tamanho da página e exportar no formato que preferir.

    
por DafyddG 07.01.2015 / 00:54
1

Se você quiser recortar uma imagem de um pdf com um visualizador de pdf, você pode tentar okular. Pode cortar qualquer coisa (textos ou imagens) em formato png ou jpeg. Se você quiser extrair imagens em formato png de um pdf, você pode fazê-lo com o mínimo de comando com o pdftohtml. Converte pdf para html e imagens. Aqui você pode encontrar um exemplo - link . Se você quiser extrair muitas imagens de um pdf, sugiro que tente isso.

    
por user203413 06.07.2015 / 17:09