Como destilar / rasterizar um PDF no Linux

10

Temos uma impressora em nosso escritório que imprime arquivos PDF de um pendrive. Ele imprime a maioria dos arquivos, mas tem problemas com alguns, especialmente aqueles gerados com o Latex. Alguns PDFs simplesmente se recusam a imprimir, alguns PDFs são impressos com fontes do tipo courier e alguns são impressos com precisão, exceto por equações.

Estou procurando uma maneira de "destilar" PDFs em um formato inoperante para impressão. Ou simplificando / normalizando o PDF ao ponto em que qualquer renderizador irá processá-lo corretamente, ou simplesmente tornando cada página uma imagem raster de 600dpi no PDF. (Eu poderia dividir o PDF em imagens de raster individuais e combiná-las manualmente, mas quero algo com script).

O tamanho do arquivo de saída não importa, desde que seja impresso, tenha tamanho de papel A4 (ou original) e resolução de 300 ~ 600 dpi.

    
por Sampo 25.08.2014 / 09:23

2 respostas

13

Após tentar, sem sucesso, algumas opções para renderizar as fontes como contornos (incluindo esta questão e pstoedit), eu descobri uma maneira de converter facilmente o PDF em formato rasterizado usando o ImageMagick:

convert -density 600 +antialias input.pdf output.pdf

Isso cria um PDF renderizado a 600 dpi, com o antialias desligado (desnecessário nessa resolução).

Os arquivos de saída são enormes (~ 30 MB para um documento de 8 páginas) e extremamente lentos para imprimir, mas devem funcionar contanto que a impressora tenha memória suficiente para renderizar o conteúdo.

    
por 25.08.2014 / 12:20
-1

Outra alternativa é converter para imagens por meio de algo como

pdfimages

A partir da página man, "Pdfimages salva imagens de um arquivo Portable Document Format (PDF) como arquivos Portable Pixmap (PPM), Portable Bitmap (PBM) ou JPEG. Pdfimages lê o arquivo PDF Arquivo PDF, escaneia um ou mais páginas e grava um arquivo PPM, PBM ou JPEG para cada imagem, image-root-nnn.xxx, onde nnn é o número da imagem e xxx é o tipo de imagem (.ppm, .pbm, .jpg). "

Em seguida, use o pdftk para converter de volta para PDF link

Finalmente, imprima este arquivo. Obviamente, a questão chave é como roteirizar isso.

Você pode automatizar isso por meio de uma página da web simples de algum tipo para os usuários. Finalmente, eles imprimem o arquivo convertido e você deve ter um desempenho superior e uma impressão de trabalho?

    
por 25.02.2015 / 15:05