Digitalização, OCR e adição dos números digitalizados

1

Preciso digitalizar centenas de páginas com números escritos no canto inferior direito. Post scan - Eu preciso de um software OCR para reconhecer o número escrito no canto inferior direito de cada página e soma-los no final.
Até agora eu poderia digitalizar páginas e usar o OCR no Adobe Acrobat, eu poderia identificar os números marcados de mão nas páginas. Existe um mecanismo ou qualquer outro software OCR que passaria os valores para programas como o MS Excel.
Eu tentei vários programas de OCR como Neurograph (opensource) e versão de teste de outros softwares OCR, mas não consegui vinculá-los diretamente a arquivos digitalizados. Eles têm a capacidade de exportar os valores do OCR para o Excel, mas não se conectam diretamente à impressora.
Também estes softwares são executados em lotes. É possível tornar as atualizações um processo contínuo?
Alguma sugestão?
Configuração do sistema:
O sistema pretendido será um PI de framboesa conectado a um scanner. Do scanner, a entrada seria dada ao PI e, por sua vez, o PI calcularia a soma e atualizaria um banco de dados com o total.

    
por Prasanna 29.08.2014 / 11:12

1 resposta

0

Se você for personalizar o hardware usando o raspberry pi, também pode personalizar o software. O pacote de OCR mais popular e amplamente usado é o Tesseract OCR em execução em OpenCV , que são Open Source e multi-plataforma. Juntos, eles permitirão que você aplique filtros, faça o OCR e, possivelmente, outras coisas legais que desejar.

Eu recomendo que você procure alguns dos vídeos por aí, o que faz com que pareça surpreendentemente fácil de configurar.

link

link

    
por 05.09.2014 / 18:16