Como eu salvo um arquivo PDF de imagem como uma imagem?

31

Eu tenho um PDF que contém uma imagem digitalizada de um documento. Eu quero salvar o conteúdo deste PDF como uma imagem para que eu possa executá-lo através de um programa OCR que aceita apenas os arquivos do tipo .jpg, .png e .gif.

Como faço para salvar / converter este PDF em um desses formatos de imagem?

EDIT: Uma maneira que eu encontrei para fazer isso é clicar em cada página. Copiar para área de transferência. Cole no Paint.net e salve. No entanto, isso é complicado, pois parece que você só pode selecionar uma página por vez no Acrobat Reader.

    
por Guy 30.09.2009 / 18:54

12 respostas

20

Please pay close attention to pooryorick's answer, in which he points out how sleske's answer is actually a much better answer for this particular problem.

Use GhostScript . Este comando funciona para mim:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Existem vários pseudo-dispositivos png, que diferenciam a profundidade de cor: pngmono, pnggray, png16, png256, png16m e pngalpha. Escolha o que melhor lhe convier.

Você também pode usar o jpeg, mas, a menos que tenha um problema de espaço em disco, você deseja ter uma qualidade tão alta quanto o seu OCR, e isso não é jpeg.

O GhostScript não tem mais suporte para gif, mas não consigo imaginar por que você precisa disso, com o suporte ao png256.

    
por 30.09.2009 / 19:19
18

Instale Imagemagick . Abra uma janela ou terminal cmd:

convert myfile.pdf myfile.jpg

A saída será 1 arquivo jpg para cada página em seu pdf, teste-0.jpg, teste-1.jpg, etc.

    
por 01.10.2009 / 01:39
13

Há também pdfimages das ferramentas Xpdf (disponíveis no site do XpdfReader ). Ele não converterá uma página inteira do PDF em uma imagem, mas sim extrairá imagens incorporadas de um PDF.

Isso é útil se o PDF contiver texto e imagens e você quiser apenas as imagens. Além disso, irá extrair as imagens no seu formato original, pelo que não há perda de qualidade (ao contrário dos programas que processam a página inteira e depois a convertem para, por exemplo, JPEG). Dependendo de suas necessidades, isso pode ser útil.

Uso simples:

pdfimages -j -list mydocument.pdf mydocument-images

Isso lerá o arquivo de entrada mydocument.pdf , extrairá todas as imagens e as gravará em arquivos individuais chamados mydocument-images-0000.jpg , mydocument-images-0001.jpg etc.

A opção -j faz com que ele grave imagens compactadas JPEG compactadas como arquivos JPEG, não como arquivos PBM / PGM / PPM (que são descompactados e grandes). Observe que as imagens ainda podem ser gravadas como arquivos PBM / PGM / PPM, se é assim que foram armazenadas no arquivo de entrada PDF.

    
por 12.02.2010 / 00:23
10

Você pode fazer isso usando um leitor de adobe:

  1. Clique na imagem. Será destacado.
  2. Copie (Ctrl-C) e cole-o no Paint.
  3. Salve como qualquer tipo de arquivo desejado.
por 30.09.2009 / 18:58
9

Com exceção da resposta que menciona as imagens em pdf, todas as outras respostas não mencionam que suas soluções realmente transcodificam as imagens incorporadas. Ou seja, essas soluções não simplesmente extraem a imagem original, mas a modificam, possivelmente em detrimento da imagem, durante o processo. Somente pdfimages extrai a imagem original. Isso se aplica ao Ghostscript, ao Imagemagick, ao Adobe Reader, ao PDFFill, ao PDF Xchange Viewer, ao OS X Preview e à maioria dos outros softwares PDF.

    
por 27.09.2012 / 01:15
4

PDFill PDF Tools é provavelmente a maneira mais fácil de converter seus PDFs em imagens no Windows. Ele permitirá que você exporte todas as páginas do PDF para separar as imagens de uma só vez. Ele também tem muitos outros recursos disponíveis gratuitamente, que só estão disponíveis em outros visualizadores de PDF se você comprar a versão comercial ou "Pro".

Use o botão "Converter PDF em imagens" (botão # 10) na imagem abaixo.

SevocêprecisarconcatenarasimagensemumaimagemmuitoaltaparaalimentarapenasumarquivoemseuprogramadeOCR,use IrfanView

    
por 30.09.2009 / 19:41
2

Como você não incluiu uma tag do SO, incluirei uma resposta do OSX:

Por padrão, PDFs são abertos no Preview.app, que permite usar File -> Save-As :

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF
por 30.09.2009 / 19:24
1

Além disso, o PDF Xchange Viewer (gratuito) fará a exportação para o arquivo . Arquivo → Exportar → Exportar para imagem.

Não só isso, mas eu acho que é o melhor visualizador de PDF livre para Windows, e tem alguns recursos de marcação agradáveis. Eu tenho uma licença para o Adobe Acrobat e ainda prefiro isso, a menos que eu esteja fazendo uma edição extensiva, o que raramente acontece.

    
por 30.09.2009 / 20:57
1

(Não-livre) O Acrobat Professional faz isso:

Avançado- > Processamento de documentos- > Exportar todas as imagens ...

    
por 07.05.2011 / 21:31
0

Se o arquivo tiver menos de 5 MB e você não estiver preocupado com privacidade / confidencialidade, é um serviço on-line útil no link que pode fazer muitas conversões gráficas (incluindo pdf para jpeg)

    
por 30.09.2009 / 19:53
-1

Se a imagem exceder o tamanho da sua tela, você pode usar o FastStone Capture ( o recurso "Capture Scrolling Window") e salve a imagem como um arquivo JPEG.

    
por 30.09.2009 / 19:26
-1

Você pode conferir este artigo .

Ele lista 6 maneiras diferentes de converter o pdf em imagens.

Converter PDF em JPG (o modo da Web)

PDF para conversores JPG para o ambiente de trabalho

por 26.03.2013 / 21:50

Tags