Descobrindo metadados sobre um PDF

24

Suponha que eu tenha um PDF e queira obter os metadados disponíveis para esse PDF. Qual utilitário devo usar?

Acho que a informação que geralmente tenho mais interesse em saber é o tamanho do papel, algo que os espectadores de PDF geralmente não relatam. Por exemplo. é a letra do tamanho do PDF, legal, A4 ou outra coisa? Mas as outras informações disponíveis também podem ser interessantes.

EDIT: Aqui é um guia útil para tamanhos de papel, graças ao @terdon.

    
por Faheem Mitha 29.06.2014 / 17:08

2 respostas

29

Uma das ferramentas canônicas para isso é pdfinfo , que vem com xpdf, se bem me lembro. Exemplo de saída:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5
    
por 29.06.2014 / 17:12
9

Outro utilitário que merece atenção é exiftool . Pode não ser a ferramenta certa no seu caso específico, pois não reporta nenhuma informação sobre a geometria do documento, mas, em geral, é provavelmente a ferramenta com mais recursos para a inspeção de metadados em PDF.

Veja um exemplo de comando que imprimirá todas as meta informações disponíveis ( -a ), classificadas por grupos ( -G1 ):

exiftool -a -G1 "$File"

A documentação oficial oferece uma visão geral das tags relacionadas a PDF suportadas:

Você pode instalar o exiftool no Debian / Ubuntu com:

sudo apt-get install libimage-exiftool-perl

Se você está mais no lado da GUI, pode dar uma chance ao PDFMtEd do meu projeto. É um conjunto de ferramentas que servem como front-ends gráficos para o exiftool e permitem a visualização e edição de metadados em PDF.

Aqui estão algumas capturas de tela:

    
por 29.06.2014 / 17:44