Combina partes de páginas de um documento PDF

3

Eu tenho um PDF que tem algum conteúdo dividido em duas páginas.

A primeira parte ocupa menos ou igual a metade inferior da primeira página e a segunda parte ocupa menos que a metade superior da segunda página. Por exemplo, se x for o conteúdo desejado na primeira página e y for o conteúdo desejado na segunda página e - for o conteúdo que não quero estar no documento de saída, temos:

|-|  |y|
|-|  |y|
|-|  |-|
|x|  |-|
|x|  |-|

E eu gostaria de ter

|x|
|x|
|y|
|y|

em uma página.

É possível mesclar essas partes dessa maneira no Linux?

    
por marmistrz 02.02.2015 / 16:14

1 resposta

3

Acredite que você deve conseguir ajustar esse script para fazer o que quiser:

É um pouco pesado usando:

  • pdfinfo - obtenha dimensões.
  • gs - extrai caixas das páginas.
  • pdftk - agrupe em um PDF.
  • pdfjam - gere 1 de 2 páginas.

A partir de agora, ele trabalha para tamanhos iguais extraídos de cima / baixo. (Atualmente codificado com offs = 50 AKA 50%). Com alguns ajustes, você deve conseguir fazê-lo funcionar, por exemplo, 70% - 30% ou o que nunca.

pdf50x50 :

#!/bin/bash

if ! [ -r "$1" ]; then
    printf "Unable to read file \'%s'\n" "$1" >&2
    exit 1
fi
fn_in="$1"

# A (debug) counter for "temp" files.
# NOTE: Printing to file .pdftestnr in working directory
fn_nr=.pdftestnr

[ -r $fn_nr ] && nr=$(<$fn_nr) || nr=0
((++nr))
printf %d $nr > $fn_nr

# File names.
fn_top=$(printf "top-%03d.pdf" $nr)
fn_bottom=$(printf "bottom-%03d.pdf" $nr)
fn_combi=$(printf "combi-%03d.pdf" $nr)
fn_fine=$(printf "fine-%03d.pdf" $nr)

# Get dimensions
read -r p w h <<<$(pdfinfo $fn_in | awk '/^Pages:/{print $2}/^Page size/{print $3, $5}')
# Calculate pixel dimensions (might fail.)
((pix_w = w * 10))
((pix_h = h * 10))

printf "Size %dx%d pts of %d pages\n" $w $h $p

# Percent
offs=50

((offs = h * offs / 100))
((pix_crop_h = pix_h - offs * 10 ))

echo $pix_crop_h $offs

# Extract top box to own pdf.
gs \
    -o $fn_top \
    -sDEVICE=pdfwrite \
    -g${pix_w}x$pix_crop_h \
    -c "<</PageOffset [0 -$offs]>> setpagedevice" \
    -f $fn_in

# Extract bottom box to own pdf.
gs \
    -o $fn_bottom \
    -sDEVICE=pdfwrite \
    -g${pix_w}x$pix_crop_h \
    -c "<</PageOffset [0 0]>> setpagedevice" \
    -f $fn_in


# Combine top and bottom files to one file.
pdftk \
  A=$fn_top \
  B=$fn_bottom \
  cat A1 B2 \
  output $fn_combi \
  verbose

# Combine 2 pages to one.
pdfjam $fn_combi --nup 1x2 --outfile $fn_fine
    
por 02.02.2015 / 20:48

Tags