Como extrair um JPEG de um PDF [duplicado]

1

Eu tenho uma imagem JPEG dentro de um arquivo PDF, eu sei que é um JPEG, porque quando eu abro o arquivo com um editor hexadecimal eu posso ver JFIF string presente nele. Como faço para extraí-lo em um arquivo separado.

O arquivo específico que eu tenho apenas uma imagem e está na primeira página.

Eu sei que é possível usar convert do pacote Image Magic para converter a imagem, mas isso significará que uma conversão dupla ocorrerá possivelmente tornando a imagem de pior qualidade ou tamanho desnecessariamente maior.

    
por v010dya 26.09.2017 / 12:24

1 resposta

1

Para extrair uma imagem, é necessário um pdfimages instalado automaticamente.

A linha de comando será a seguinte:

pdfimages -j file.pdf ./

Por favor, note que a barra é necessária, se for omitida, o processo de extração não acontecerá e nenhuma mensagem de erro será gerada. Também é possível dar aos arquivos um prefixo inicial como ./prefix , então todos eles serão colocados no diretório atual e começarão com o prefixo fornecido.

Não é possível limitar pdfimages para extrair apenas um único arquivo, mas é possível fornecer a página que ele processará usando as opções -f (primeira página) e -l (última página). Todas as opções devem ser fornecidas antes do arquivo de entrada.

    
por v010dya 26.09.2017 / 12:24