Extrair páginas pares e ímpares de um PDF em dois PDFs separados

5

Eu tenho um PDF que consiste em várias centenas de páginas de texto bilingue. Como preciso usar o OCR em cada idioma separadamente, quero pegar as páginas pares e ímpares e criar dois PDFs separados usando convert ou ghostscript . O idioma que quero fazer primeiro é nas páginas ímpares. Que comando convert ou ghostscript posso usar para pegá-los e gravá-los em um novo arquivo?

    
por ixtmixilix 26.06.2011 / 15:47

2 respostas

12

Eu faria isso com o pdftk .

pdftk A=all.pdf cat Aodd output odd.pdf
pdftk A=all.pdf cat Aeven output even.pdf
    
por 26.06.2011 / 16:04
2

Com as ferramentas poppler-utils , você pode primeiro extrair páginas únicas com pdfseparate :

pdfseparate infile.pdf piece-%d.pdf

em partes como piece-1.pdf , piece-2.pdf ... piece-n.pdf , em que n é o número total de páginas em seu pdf original.

Você pode, então, juntar-se a eles com pdfunite (e um shell que suporta o uso de um valor de incremento com expansão de intervalo: {<START>..<END>..<INCR>} ):

pdfunite piece-{1..n..2}.pdf odd.pdf
pdfunite piece-{2..n..2}.pdf even.pdf

Por fim, remova as peças:

rm piece-{1..n}.pdf
    
por 07.08.2015 / 15:08