Eu tenho 20 páginas de dados de medição de experimentos que preciso digitalizar. Os resultados estão em formato tabular, digitalizados em resolução de 600 dpi e, na medida em que as digitalizações são feitas, eles são bem limpos e legíveis.
Veja um exemplo de como fica:
...eeuprecisoquetermineatédomingoàtarde(:-o)<-smileyemestadodepânico
(entãoporquevocênãocomeçoumaiscedo?)...sim,sim...eusei...mas,chegoutarde,eeunãoestavapensandoqueiriaprecisardessesdadostambém.
Então,estouprocurandorecomendações.EunãotenhomuitaexperiênciacomprogramasdeOCR,salvodigitalizarumapáginaouduasdetextopuro,massóparamencionar,eunãotenhoodesejotambémdetestartodososprogramasdeOCRporaí.Portanto,estenãoéum"nome favorito do seu OCR".
O que eu estou procurando é o conselho de alguém que tenha feito algo assim, e a experiência dele / dela sobre qual seria a melhor maneira de fazer isso.
Eu preciso dos dados em formato txt, mas como ele terá que ser verificado (desenhando-o, e simplesmente observando se alguns pontos "saltam") eu provavelmente estarei inserindo-o no Excel no começo.