Abbyy bom leitor como aplicativo para o Ubuntu 13.04

4

Eu tenho muitas imagens e o que eu quero fazer é digitalizar essas imagens e obter uma saída em um arquivo ms que pode ser editado depois. Para o Windows, tenho o bom leitor Abbyy. Mas eu não quero voltar para o Windows. Por favor, diga-me se existe algum aplicativo que possa fazer o mesmo por mim. Por favor me ajude nisso.

    
por Faisal Aslam 19.05.2013 / 09:52

2 respostas

1

Você pode usar o OCR da Abbyy.

  

O CLI do ABBYY FineReader Engine para Linux é um pronto para usar a ferramenta CLI   nas tecnologias avançadas de reconhecimento óptico de caracteres (OCR) da ABBYY.   A ferramenta automatiza o OCR e a conversão de documentos em sistemas Linux.

Para mais informações e para fazer o download, visite o site site .

Fonte: Ocr4Linux

    
por Mitch 19.05.2013 / 19:44
1
Primeiro de tudo, aqui estão algumas outras ferramentas de OCR além do Abbyy que possuem um SDK e você pode usar no Linux. Mas note que nem todos eles suportam a saída do MS Word:

  • Tesseract - somente saída de texto
  • Ocrad - apenas saída de texto
  • GOCR - apenas saída de texto
  • CuneiForm - saída RTF
  • OmniPage - Google Docs e saída em PDF

Aqui está um artigo (a partir de 2007, mas provavelmente ainda relevante) comparando os três primeiros motores com precisão e velocidade: link

A propósito, todos os mecanismos, incluindo o Abbyy, são melhores para textos não estruturados - em outras palavras, imagens que não seguem uma estrutura regular. Se as "imagens" que você está processando tiverem um layout padrão, por exemplo, formulários preenchidos por clientes (onde os campos estão sempre no mesmo local), vários cartões (tais como cartões de visita, cartões de identificação), etc., existem soluções especializadas que podem detectar e OCR apenas os campos de texto específicos, "limpos" out image "noise", e saída do texto de forma estruturada (por exemplo, Nome = John Smith, Número de ID = 123456).

Se as suas imagens são "modelos", e você precisa de um OCR que possa produzir texto estruturado, na verdade existem muito poucas soluções Linux (até onde eu sei). Aqui estão duas soluções que eu conheço:

  • OCR CSSN ( link ). Especializa-se em documentos do tipo cartão, como carteiras de identidade, carteiras de motorista, cartões médicos, cheques bancários, cartões de crédito, etc. É executado no Linux usando o WINE.
  • ARH ( link ). Capaz de ler documentos de viagem, passaportes, vistos e cartões de identificação.

HTH, Dana

    
por Dana Brandt 01.01.2014 / 12:10