Tamanho da imagem com gscan2pdf e ImageMagick 'convert' bloat

3

Verifico todos os meus importantes emails físicos recebidos em PDF. Estou tentando mover essa atividade para o Linux como parte do processo de eliminar minha dependência do Windows - onde costumava usar o excelente mas profundamente proprietário NitroPDF para fazer a varredura e a conversão.

Então eu mudei para usar gscanpdf v 1.2.3 no Ubuntu 14.04 x_86_64 com um scanner Canon LiDE. Se eu digitalizar uma imagem em linha de arte 300DPI, isso me dá um tamanho razoável de arquivo por página (cerca de 150 kB), mas por algum motivo embora eu tenha a geometria de página definida como A4 em gscan2pdf , a imagem sempre sai como A0 (ou seja, massivo) que confunde muitos leitores e também torna a impressão de coisas estranhas. Então, para ilustrar eu fiz a varredura de uma única página de A4:

tim@MERLIN:~/Documents/Scanned$ pdfinfo sample.pdf
Title:          LabourLeaflet
Subject:        NONE
Keywords:       NONE
Author:         001-MCC
Creator:        gscan2pdf v1.2.3
Producer:       PDF::API2
CreationDate:   Mon Aug 18 00:00:00 2014
ModDate:        Mon Aug 18 00:00:00 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      2380.8 x 3366.7 pts
Page rot:       0
File size:      117573 bytes
Optimized:      no
PDF version:    1.4

que, como você pode ver, dá uma geometria de página de A0. Agora eu posso converter a geometria da página usando o comando convert do ImageMagick assim:

tim@MERLIN:~/Documents/Scanned$ convert sample.pdf -page A4 -compress zip sample1.pdf
tim@MERLIN:~/Documents/Scanned$ pdfinfo sample1.pdf
Title:          sample1
Producer:       ImageMagick 6.7.7-10 2014-03-06 Q16 http://www.imagemagick.org
CreationDate:   Tue Aug 19 10:04:36 2014
ModDate:        Tue Aug 19 10:04:36 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595 x 842 pts (A4)
Page rot:       0
File size:      689083 bytes
Optimized:      no
PDF version:    1.4

que, como você pode ver, deixa a geometria correta, mas faz com que o arquivo inche seis vezes o tamanho original.

Então:

  1. Existe alguma maneira de obter gscan2pdf para respeitar a geometria da página A4 que defini (ideal); ou
  2. Posso obter o ImageMagick para alterar o tamanho da página sem inchar; ou
  3. Existe algum outro pacote em que eu deveria estar pensando além de gscan2pdf e convert ?
por TimGJ 19.08.2014 / 11:18

2 respostas

2

Esse bug parece ter sido corrigido na versão 1.2.5 (eu atualizei para o 1.2.5 e usei o programa várias vezes e ele sempre selecionou o tamanho correto do papel).

    
por 23.08.2014 / 10:52
0

tem o mesmo problema, e depois de mexer muito com as configurações, é essencial salvar, para que a compactação (abaixo da caixa de seleção diminuir a amostra) seja definida como JPEG e uma qualidade razoável (75, por exemplo). Isso realmente faz a diferença

    
por 30.04.2015 / 17:53