Reconhecimento óptico de caracteres para o LibreOffice

2

Eu tenho um documento em papel. Existem mais páginas contendo uma tabela com 3 colunas (número atual, nome e nota).

Eu fiz a varredura e consegui 16 documentos jpeg. Cada jpeg é uma página digitalizada.

Agora, preciso de um OCR para converter cada jpeg em texto, para inserir essa tabela em um documento do Excel.

Eu uso o LibreOffice e o Ubuntu 12.04.

    
por Mihaita 03.07.2013 / 16:14

2 respostas

4

A página Digitalização e OCR no Ubuntu Apps mostra nós várias alternativas, das quais eu sugiro que você use Programa de Varredura de Imagens XSane ou Verificação simples (geralmente pré-instalado em 12.04 e talvez versões anteriores também) e / ou < um href="https://apps.ubuntu.com/cat/applications/precise/gscan2pdf/"> gscan2pdf , para obter seus documentos digitalizados.

O meu favorito é o gscan2pdf , que permite seguir o processo de Digitalização / OCR na mesma GUI sem problemas.

Por favor, note que estou tentando executar um OCR para uma captura de tela.

Você simplesmente digitaliza ou importa os documentos / imagens e acessa o menu Ferramentas, escolhe a opção de OCR e será solicitado um mecanismo de OCR. Basta escolher aquele que oferece os melhores resultados e clicar em "Iniciar OCR". ".

Você encontrará o resultado do OCR na guia com o mesmo título, conforme mostrado na próxima captura de tela.

Por favor, note que mesmo com imagens de boa qualidade, o OCR pode falhar na interpretação de certos caracteres, o que pode resultar em palavras com erros ortográficos ou simplesmente hieróglifos egípcios. O processo para o OCR um grande conjunto de documentos pode demorar um pouco.

Este é um link para um vídeo abrangente que explica o processo de verificação e OCR no GScan2PDF: link

Boa sorte!

    
por Geppettvs D'Constanzo 03.07.2013 / 20:51
2

Demora em responder a essa pergunta.

Mas para outras pessoas que chegam a esta página em busca de uma solução de OCR para o LibreOffice, desenvolvi recentemente o LibreOCR, um plugin OCR para o LibreOffice.

É parte do projeto Indic-OCR .

A extensão agora pode ser encontrada em Site de extensões do LibreOffice

    
por RKVS Raman 12.12.2016 / 10:04