Extraia gráficos de PDFs

4

Eu tenho uma situação onde eu preciso extrair imagens de muitos arquivos PDF e exibi-los em um site. Meus PDFs têm imagens "regulares" e muitos gráficos.

Eu usei pdf2xml e ele extrai as imagens nos formatos jpeg, ppm, pbm e vec. Eu vejo as imagens "regulares" sendo extraídas (na maioria das vezes) como jpeg / ppm / pbm, mas não vejo os gráficos estando lá - e estou supondo que o pdf2xml está armazenando-os como arquivos .vec.

Então, a questão é como obter meus gráficos? Eu usei convert que vem com o imagemagick para converter .vec para jpeg / png, mas sem sucesso.

    
por user6891 23.04.2011 / 21:07

1 resposta

2

Eu nunca tentei pdf2xml, mas navegando através de seus arquivos no SourceForge, eu encontrei vec2svg-2.py , que parece ser um script Python para converter arquivos .vec para .svg. Você não deve ter dificuldade em converter SVG para o formato que precisar.

python vec2svg-2.py -i file.vec -o file.svg
    
por 23.04.2011 / 22:11