DiffPDF
O DiffPDF é usado para comparar dois arquivos PDF - textualmente ou visualmente.
O DiffPDF pode comparar dois arquivos PDF. Oferece três modos de comparação: palavras, caracteres e aparência.
Existe alguma ferramenta disponível para realizar um diff entre dois arquivos PDF? Ou é melhor extrair o texto e compará-lo no diff?
DiffPDF
O DiffPDF é usado para comparar dois arquivos PDF - textualmente ou visualmente.
O DiffPDF pode comparar dois arquivos PDF. Oferece três modos de comparação: palavras, caracteres e aparência.
O Portable Document Format (PDF) é um formato de arquivo binário. Embora existam provisões na especificação para não compactar o texto ASCII no arquivo (supondo que o texto esteja alinhado aos limites de 8 bits), a maioria dos arquivos PDF é compactada por padrão para economizar espaço (mesmo que levemente) . Por esse motivo, seria impossível diretamente diff
dos arquivos binários (é provável que o arquivo inteiro tenha sido alterado).
O método mais fácil e confiável é, como sua intuição o levou, a extrair o texto e comparar esse usando diff
.