Primeiro de tudo, aqui estão algumas outras ferramentas de OCR além do Abbyy que possuem um SDK e você pode usar no Linux. Mas note que nem todos eles suportam a saída do MS Word:
- Tesseract - somente saída de texto
- Ocrad - apenas saída de texto
- GOCR - apenas saída de texto
- CuneiForm - saída RTF
- OmniPage - Google Docs e saída em PDF
Aqui está um artigo (a partir de 2007, mas provavelmente ainda relevante) comparando os três primeiros motores com precisão e velocidade: link
A propósito, todos os mecanismos, incluindo o Abbyy, são melhores para textos não estruturados - em outras palavras, imagens que não seguem uma estrutura regular. Se as "imagens" que você está processando tiverem um layout padrão, por exemplo, formulários preenchidos por clientes (onde os campos estão sempre no mesmo local), vários cartões (tais como cartões de visita, cartões de identificação), etc., existem soluções especializadas que podem detectar e OCR apenas os campos de texto específicos, "limpos" out image "noise", e saída do texto de forma estruturada (por exemplo, Nome = John Smith, Número de ID = 123456).
Se as suas imagens são "modelos", e você precisa de um OCR que possa produzir texto estruturado, na verdade existem muito poucas soluções Linux (até onde eu sei). Aqui estão duas soluções que eu conheço:
- OCR CSSN ( link ). Especializa-se em documentos do tipo cartão, como carteiras de identidade, carteiras de motorista, cartões médicos, cheques bancários, cartões de crédito, etc. É executado no Linux usando o WINE.
- ARH ( link ). Capaz de ler documentos de viagem, passaportes, vistos e cartões de identificação.
HTH,
Dana