Por que o PDF com apenas uma imagem é bem maior que a imagem?

4

Gostaria de incorporar um documento digitalizado em um documento PDF.

A imagem da fonte é de cerca de 300kB.
Se eu usar o comando converter , o PDF terá um tamanho de 30MB e, com o GIMP, 3MB.

Aqui, os tamanhos de arquivo resultantes de vários comandos. A única maneira que encontrei para obter um tamanho de arquivo PDF razoável é converter primeiro para JPEG e depois para PDF.

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

Os arquivos estão disponíveis aqui .

    
por Gael 28.01.2016 / 17:50

2 respostas

0

A principal razão na minha opinião é que o PDF armazena as configurações de compatibilidade que podem aumentar o tamanho do arquivo. Se você usa o Adobe Acrobat, pode reduzir o tamanho do arquivo PDF e remover essas configurações.

Ou você pode incorporar sua imagem no Word. Basta inserir a imagem e salvar o arquivo como PDF, mas escolha "Tamanho mínimo (publicação on-line)" ao selecionar PDF no menu "Salvar como tipo".

As configurações de compatibilidade são o que tornam o PDF visível e imprimível com uma qualidade razoável e talvez sejam a razão por trás do PDF amplamente difundido.

    
por 28.01.2016 / 18:10
0

Os PDFs sempre têm um tamanho de papel implícito, como 8,5 x 11 polegadas, e normalmente são exportados em 250 a 300 ppi.

Uma folha de papel 8,5x11 terá cerca de 2550x3300 pixels.

Uma imagem colorida RGB para a tela é de 3 "canais" (imagens em escala de cinza) e CMYK é 4. A escala de cinza é de canal único.

Para "imagens normais", um pixel é de 1 byte por canal.

Portanto, 2550x3300x3 / 1024/1024 = cerca de 24 MB para RGB (32 MB para CMYK) (não compactado).

Parece certo. A compactação de Jpeg leva você muito mais, mas à custa da qualidade, pois destrói os dados durante o processo de compactação.

Note que colocar uma imagem de um documento em um contêiner PDF de origem 0,0 com um tamanho de página = tamanho de imagem não faz nada para você. É como embrulhar um presente em outro presente.

Se você estiver digitalizando documentos em P & B, poderá reduzir o tamanho em 1/3 inicialmente sem usar o modo RGB.

Lembre-se de que as imagens JPEG não-rgb não são universalmente suportadas.

    
por 28.01.2016 / 20:19