Como converter um arquivo .pdf em uma pasta de imagens?

12

Eu tenho alguns arquivos .pdf que eu gostaria de converter para o meu formato de leitura preferido de .cbr ou .cbz ou, se isso não for diretamente possível, eu preciso extrair todas as páginas do .pdf como imagens e depois comprimi-los no meu formato de escolha. Eu só consegui salvar as páginas uma por vez com o Document Viewer. Obviamente, gostaria de fazer isso um pouco mais rápido. Eu tentei pdfsam, pdf shuffler e pdfmod todos sem sorte. Estou usando o Ubuntu 11.10.

    
por Shawn 24.11.2011 / 15:58

5 respostas

11

OK, eu fiz mais algumas pesquisas e, embora o método do tohuwawohu funcione, achei mais fácil usar um programa chamado pdftoppm para conseguir o que eu queria fazer. Desde que eu sou praticamente um leigo quando se trata de usar aplicativos de linha de comando, eu farei o meu melhor para explicar como consegui que isso funcione para mim.

  1. Navegue até a pasta que contém o .pdf que você deseja editar e abra um terminal lá. Eu fiz isso usando o comando de amostra:

    cd ~/Documents/PDF
    
  2. Digamos que o arquivo que eu quero editar se chame Sample.pdf. O que eu quero fazer é usar o pdftoppm para criar arquivos de imagem de cada página do arquivo .pdf. Vários formatos podem ser escolhidos (veja o link man pages acima), mas eu prefiro usar o .png. O comando básico é assim:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    ou no exemplo acima:

    pdftoppm -png Sample.pdf Sample
    

    Este comando cria um arquivo de imagem de cada página na mesma pasta do arquivo .pdf original com nomes como Sample-01.png, Sample-02.png e assim por diante. Eu tentei com as extensões .png e .jpeg com sucesso. .jpg aparentemente não é suportado.

  3. Depois, uso o Gerenciador de arquivos selecionando todos os arquivos de imagem criados recentemente, clicando e escolhendo "Compactar" no menu de contexto. Eu então escolho o formato de arquivo que eu prefiro (neste caso, .cbz ou Zip Comic Book) e crie o novo arquivo.

  4. Agora eu tenho um novo e brilhante arquivo .cbz chamado Sample.cbz, que eu posso ver com meu leitor Comix !

Espero que o que eu tenha postado acima faça sentido o suficiente para que alguém possa aprender com isso. Se eu precisar alterá-lo de alguma forma, por favor me avise.

    
por Shawn 25.11.2011 / 18:18
3

Eu não estou muito familiarizado com * .cbr / * .cbz, mas parece que você terá que combinar duas etapas:

  1. Converter PDF em imagens
  2. Compacte-os em um arquivo ZIP / RAR.

Com relação à etapa 1, você pode usar o comando ImageMagick convert . Você pode alimentar convert com um PDf compreendendo várias páginas e convert retornará cada página como um único arquivo gráfico. Eu testei com um texto digitalizado a 400 dpi, e o seguinte comando resultou em bons JPGEs:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(créditos referentes à opção -quality : esta entrada no fórum )

Como resultado, você obtém 000.jpeg , 001.jpeg e assim por diante. Basta compactá-los em um arquivo .cbz e pronto.

Você pode até combinar as duas etapas "concatenando":

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && zip -vm comic.cbz *.jpg

(certifique-se de que não há outros JPEGs em seu diretório de trabalho atual, já que usando o código acima, o zip moverá todos os JPEGs para o arquivo cbz)

    
por tohuwawohu 24.11.2011 / 16:29
3

Tente usar o calibre para converter diretamente o arquivo .pdf em .cbr ou .cbz.

    
por bntser 24.11.2011 / 16:09
3

Eu escrevi um script bash simples exatamente para esse propósito, você precisará do poppler instalado, então:

sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

Aqui está o script bash (salve como convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "" "./$filename/000"
zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

Para usar o script bash:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

Espero que isso seja útil para alguém!

    
por Alasdair Morrison 07.03.2015 / 13:10
1

Parece que a maneira mais fácil é usar o Acrobat Pro.

  1. Abra o PDf no Acrobat Pro.
  2. Quando o arquivo for aberto, vá para FileExportImageJPEG , ele exportará cada página como um único JPG.
  3. Coloque todos os JPGs em uma pasta
  4. Compactar a pasta.
  5. Altere manualmente a extensão no final do arquivo compactado de .zip para .cbz

Se você preferir um arquivo CBR , desmarque a pasta em vez de compactá-la e, em seguida, altere a extensão de .rar para .cbr .

    
por Eric Vincent 12.02.2012 / 23:02