Eu tenho usado o pdftotext da caixa de ferramentas xpdf antes de exportar o conteúdo como texto simples e compará-lo com a minha ferramenta de comparação favorita. No momento eu encontrei o pdfdiff , um arquivo python, que faz exatamente o que eu fiz manualmente antes. Um teste rápido mostrou que ele faz o que deveria.
Obrigado pela sua pergunta, que me fez procurar uma ferramenta nova e útil.
Editar :
Eu sugeriria usá-lo com meld , uma ótima ferramenta de comparação, que é suportada pelo pdfdiff.