Como cortar um arquivo pdf de várias páginas (imagem / digitalizada) (que não cortará com o pdfcrop)?

5

Normalmente, estou muito feliz em usar pdfcrop , embora a saída cortada consuma significativamente mais espaço em disco. Observe que código existe que resolve e resolve esse problema. No entanto, se quiser cortar um arquivo pdf digitalizado (imagem), minha impressão é que pdfcrop simplesmente falha. Eu imagino que ImageMagick é capaz de fazer o truque, possivelmente (também) nos fazendo de pdftk .

Eu estou procurando por um eficiente liner de código (um script multi-line também seria ok ...) para recortar um arquivo em formato pdf do Topo-Inferior-Esquerdo-e-Direito em x cm cada ( ou, melhor ainda, por abcd cm, individualmente), indo do input.pdf ao output.pdf.

ps: a solução não precisa envolver ImageMagick ; Estou feliz, desde que funcione (de forma limpa, confiável e eficiente) ...)

    
por nutty about natty 20.03.2013 / 18:51

3 respostas

3

O crédito total deve-se a AlexG que, por acaso, en passant publicou uma solução para este problema aqui , que, para ser completo e assim não se perder (!), cito abaixo .

Relevante para a pergunta acima é a opção trimming descrita em man :

Usage examples:

#default operation
pdfcrop.sh orig.pdf cropped.pdf
pdfcrop.sh -m 10 orig.pdf cropped.pdf
pdfcrop.sh -hires orig.pdf cropped.pdf

#trimming pages
pdfcrop.sh -t "10 20 30 40" orig.pdf trimmed.pdf

Content of pdfcrop.sh:

#!/bin/bash

function usage () {
  echo "Usage: 'basename $0' [Options] <input.pdf> [<output.pdf>]"
  echo
  echo " * Removes white margins from each page in the file. (Default operation)"
  echo " * Trims page edges by given amounts. (Alternative operation)"
  echo
  echo "If only <input.pdf> is given, it is overwritten with the cropped output."
  echo
  echo "Options:"
  echo
  echo " -m \"<left> [<top> [<right> <bottom>]]\""
  echo "    adds extra margins in default operation mode. Unit is bp. A single number"
  echo "    is used for all margins, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom margins alike."
  echo
  echo " -t \"<left> [<top> [<right> <bottom>]]\""
  echo "    trims outer page edges by the given amounts. Unit is bp. A single number"
  echo "    is used for all trims, two numbers \"<left> <top>\" are applied to the"
  echo "    right and bottom trims alike."
  echo
  echo " -hires"
  echo "    %%HiResBoundingBox is used in default operation mode."
  echo
  echo " -help"
  echo "    prints this message."
}

c=0
mar=(0 0 0 0); tri=(0 0 0 0)
bbtype=BoundingBox

while getopts m:t:h: opt
do
  case $opt
  in
    m)
    eval mar=($OPTARG)
    [[ -z "${mar[1]}" ]] && mar[1]=${mar[0]}
    [[ -z "${mar[2]}" || -z "${mar[3]}" ]] && mar[2]=${mar[0]} && mar[3]=${mar[1]}
    c=0
    ;;
    t)
    eval tri=($OPTARG)
    [[ -z "${tri[1]}" ]] && tri[1]=${tri[0]}
    [[ -z "${tri[2]}" || -z "${tri[3]}" ]] && tri[2]=${tri[0]} && tri[3]=${tri[1]}
    c=1
    ;;
    h)
    if [[ "$OPTARG" == "ires" ]]
    then
      bbtype=HiResBoundingBox
    else
      usage 1>&2; exit 0
    fi
    ;;
    \?)
    usage 1>&2; exit 1
    ;;
  esac
done
shift $((OPTIND-1))

[[ -z "$1" ]] && echo "'basename $0': missing filename" 1>&2 && usage 1>&2 && exit 1
input=$1;output=$1;shift;
[[ -n "$1" ]] && output=$1 && shift;

(
    [[ "$c" -eq 0 ]] && gs -dNOPAUSE -q -dBATCH -sDEVICE=bbox "$input" 2>&1 | grep "%%$bbtype"
    pdftk "$input" output - uncompress
) | perl -w -n -s -e '
  BEGIN {@m=split /\s+/, $mar; @t=split /\s+/, $tri;}
  if (/BoundingBox:\s+([\d\.\s]+\d)/) { push @bbox, $1; next;}
  elsif (/\/MediaBox\s+\[([\d\.\s]+\d)\]/) { @mb=split /\s+/, $1; next; }
  elsif (/pdftk_PageNum\s+(\d+)/) {
    $p=$1-1;
    if($c){
      $mb[0]+=$t[0];$mb[1]+=$t[1];$mb[2]-=$t[2];$mb[3]-=$t[3];
      print "/MediaBox [", join(" ", @mb), "]\n";
    } else {
      @bb=split /\s+/, $bbox[$p];
      $bb[0]+=$mb[0];$bb[1]+=$mb[1];$bb[2]+=$mb[0];$bb[3]+=$mb[1];
      $bb[0]-=$m[0];$bb[1]-=$m[1];$bb[2]+=$m[2];$bb[3]+=$m[3];
      print "/MediaBox [", join(" ", @bb), "]\n";
    }
  }
  print;
' -- -mar="${mar[*]}" -tri="${tri[*]}" -c=$c | pdftk - output "$output" compress
    
por nutty about natty 03.04.2013 / 13:13
12

Você pode tentar briss . É bem simples, mas faz o trabalho. É um aplicativo GUI embora.

Faça o download do arquivo zip e extraia para uma pasta de sua escolha e inicie-o:

java -jar briss-0.9.jar

Para instalá-lo permanentemente e em todo o sistema e poder iniciá-lo de qualquer lugar com apenas briss , você descompactaria o download em /usr/local/lib/ e criaria um arquivo executável /usr/local/bin/briss que contém:

#!/bin/sh
java -jar /usr/local/lib/briss-0.9/briss-0.9.jar
    
por phoibos 21.03.2013 / 13:09
10

Este aqui é o melhor e mais fácil e tem uma interface gráfica maravilhosa: Krop

Faça o download do deb do autor: link

Revisão: link

Edit: Eu estou usando o krop desde 13.10 e notei que as últimas versões do krop começaram a suportar a abertura de um pdf com o krop através do botão direito do mouse. Posso confirmar isso pelo menos para 16.04 e 16.10.

    
por Consumology 03.10.2013 / 14:31