Abbyy bom leitor como aplicativo para o Ubuntu 13.04

Question

Abbyy bom leitor como aplicativo para o Ubuntu 13.04

#1 resposta do Mitch (1 votos)
#2 resposta do Dana Brandt (1 votos)

4

Eu tenho muitas imagens e o que eu quero fazer é digitalizar essas imagens e obter uma saída em um arquivo ms que pode ser editado depois. Para o Windows, tenho o bom leitor Abbyy. Mas eu não quero voltar para o Windows. Por favor, diga-me se existe algum aplicativo que possa fazer o mesmo por mim. Por favor me ajude nisso.

files conversion ocr

por Faisal Aslam 19.05.2013 / 07:52

2 respostas

Tags files conversion ocr

Como posso impedir que o vinho modifique meu layout de exibição? problema de instalação do meld

score 1 · Answer 1

Você pode usar o OCR da Abbyy.

O CLI do ABBYY FineReader Engine para Linux é um pronto para usar a ferramenta CLI nas tecnologias avançadas de reconhecimento óptico de caracteres (OCR) da ABBYY. A ferramenta automatiza o OCR e a conversão de documentos em sistemas Linux.

Para mais informações e para fazer o download, visite o site site .

^{Fonte: Ocr4Linux}

score 1 · Answer 2

Primeiro de tudo, aqui estão algumas outras ferramentas de OCR além do Abbyy que possuem um SDK e você pode usar no Linux. Mas note que nem todos eles suportam a saída do MS Word:

Tesseract - somente saída de texto
Ocrad - apenas saída de texto
GOCR - apenas saída de texto
CuneiForm - saída RTF
OmniPage - Google Docs e saída em PDF

Aqui está um artigo (a partir de 2007, mas provavelmente ainda relevante) comparando os três primeiros motores com precisão e velocidade: link

A propósito, todos os mecanismos, incluindo o Abbyy, são melhores para textos não estruturados - em outras palavras, imagens que não seguem uma estrutura regular. Se as "imagens" que você está processando tiverem um layout padrão, por exemplo, formulários preenchidos por clientes (onde os campos estão sempre no mesmo local), vários cartões (tais como cartões de visita, cartões de identificação), etc., existem soluções especializadas que podem detectar e OCR apenas os campos de texto específicos, "limpos" out image "noise", e saída do texto de forma estruturada (por exemplo, Nome = John Smith, Número de ID = 123456).

Se as suas imagens são "modelos", e você precisa de um OCR que possa produzir texto estruturado, na verdade existem muito poucas soluções Linux (até onde eu sei). Aqui estão duas soluções que eu conheço:

OCR CSSN ( link ). Especializa-se em documentos do tipo cartão, como carteiras de identidade, carteiras de motorista, cartões médicos, cheques bancários, cartões de crédito, etc. É executado no Linux usando o WINE.
ARH ( link ). Capaz de ler documentos de viagem, passaportes, vistos e cartões de identificação.

HTH, Dana