Se você puder digitalizar o documento novamente, poderá compará-lo automaticamente com os documentos recuperados. Mas se esse for o caso, você provavelmente não precisará se recuperar.
Isso deixa de encontrar o PDF correto, e como abri-los um por um em programas como evince
é complicado, eu recomendo que você execute o seguinte no diretório onde os arquivos .pdf
são recuperados:
for i in *.pdf ; do
pdfimages -j -l 1 "$i" "${i%}"
done
Isso sairá com arquivos JPEG ( -j
opção, a menos que o arquivo digitalizado não seja JPEG, o que é improvável) com a primeira página ( -l 1
) com o mesmo nome de base dos seus PDFs.
Agora você pode usar eog
para navegar rapidamente pelas imagens extraídas até reconhecer (visualmente) o documento que está procurando. Uma vez encontrado, o arquivo de imagem terá o mesmo nome de base que o arquivo PDF que você está procurando.