Eu faria isso com o pdftk .
pdftk A=all.pdf cat Aodd output odd.pdf
pdftk A=all.pdf cat Aeven output even.pdf
Eu tenho um PDF que consiste em várias centenas de páginas de texto bilingue. Como preciso usar o OCR em cada idioma separadamente, quero pegar as páginas pares e ímpares e criar dois PDFs separados usando convert
ou ghostscript
. O idioma que quero fazer primeiro é nas páginas ímpares. Que comando convert
ou ghostscript
posso usar para pegá-los e gravá-los em um novo arquivo?
Eu faria isso com o pdftk .
pdftk A=all.pdf cat Aodd output odd.pdf
pdftk A=all.pdf cat Aeven output even.pdf
Com as ferramentas poppler-utils
, você pode primeiro extrair páginas únicas com pdfseparate
:
pdfseparate infile.pdf piece-%d.pdf
em partes como piece-1.pdf
, piece-2.pdf
... piece-n.pdf
, em que n
é o número total de páginas em seu pdf original.
Você pode, então, juntar-se a eles com pdfunite
(e um shell que suporta o uso de um valor de incremento com expansão de intervalo: {<START>..<END>..<INCR>}
):
pdfunite piece-{1..n..2}.pdf odd.pdf
pdfunite piece-{2..n..2}.pdf even.pdf
Por fim, remova as peças:
rm piece-{1..n}.pdf
Tags pdf imagemagick ghostscript