Extrair páginas pares e ímpares de um PDF em dois PDFs separados

Question

Extrair páginas pares e ímpares de um PDF em dois PDFs separados

#1 resposta do (12 votos)
#2 resposta do (2 votos)

5

Eu tenho um PDF que consiste em várias centenas de páginas de texto bilingue. Como preciso usar o OCR em cada idioma separadamente, quero pegar as páginas pares e ímpares e criar dois PDFs separados usando convert ou ghostscript . O idioma que quero fazer primeiro é nas páginas ímpares. Que comando convert ou ghostscript posso usar para pegá-los e gravá-los em um novo arquivo?

pdf imagemagick ghostscript

por ixtmixilix 26.06.2011 / 13:47

2 respostas

2

Com as ferramentas poppler-utils , você pode primeiro extrair páginas únicas com pdfseparate :

pdfseparate infile.pdf piece-%d.pdf

em partes como piece-1.pdf , piece-2.pdf ... piece-n.pdf , em que n é o número total de páginas em seu pdf original.

Você pode, então, juntar-se a eles com pdfunite (e um shell que suporta o uso de um valor de incremento com expansão de intervalo: {<START>..<END>..<INCR>} ):

pdfunite piece-{1..n..2}.pdf odd.pdf
pdfunite piece-{2..n..2}.pdf even.pdf

Por fim, remova as peças:

rm piece-{1..n}.pdf

por 07.08.2015 / 13:08

Tags pdf imagemagick ghostscript

cortando um campo para comprimento com awk / sed [duplicado] Como prefixar uma linha para todos os arquivos em um diretório?

score 12 · Accepted Answer

Eu faria isso com o pdftk .

pdftk A=all.pdf cat Aodd output odd.pdf
pdftk A=all.pdf cat Aeven output even.pdf