Eu queria fazer a mesma coisa e aqui estão as coisas que encontrei e considerei. A solução que normalmente ouço para isso é NeatReceipts ou NeatDesk . Infelizmente, não acredito que você possa obter o software deles sem ter um scanner. Isso é um pouco caro.
A outra coisa que considerei é usar os dados EXIF dos JPGs. Isso foi barato, mas não consegui encontrar uma maneira fácil de pesquisar essas informações ou torná-las úteis para o gerenciamento de documentos.
O que finalmente decidi que funcionaria para mim é usar o Adobe Acrobat . Definitivamente não é barato, mas eu também tinha outros usos para querer fazer / modificar PDFs. O Acrobat pode digitalizar documentos e inseri-los em texto pesquisável. PDF agora é um padrão aberto, mas se você está preocupado em ser compatível por longos períodos de tempo, há um formato PDF / A. Não sei se o PDF / A preservaria o texto do OCR. Documentos em PDF também tem um lugar para você inserir metadados como título, autor, palavras-chave (que eu uso como comentários). Se isso não for suficiente, você pode sempre adicionar seu próprio texto ou anotações no próprio documento.
Sei que manter registros é importante, então espero que você encontre uma solução que funcione para você.