De acordo com a especificação do PDF , pode haver alguns coisas para ajudá-lo.
Primeiro de tudo, há o ID, um identificador único que não deve ser alterado após a criação inicial.
A partir da especificação do PDF acima, Seção 14.4:
File identifiers shall be defined by the optional ID entry in a PDF file’s trailer dictionary (see 7.5.5, “File Trailer” ). The ID entry is optional but should be used. The value of th is entry shall be an array of two byte strings. The first byte string shall be a permanent identifier based on the contents of the file at the time it was originally created and shall not change when the file is increm entally updated
Em segundo lugar, você pode dar uma olhada no 7.5.6 Figura 3. De acordo com esse Figur você deve ter um corpo original.
Para a primeira opção, há uma função poppler para extrair os IDs (você está interessado no ID permanente) link , no entanto, eu não sei como você pode remover o corpo original para comparar esses hashes.