-
GOCR de é um programa OCR (Optical Character Recognition). Converte imagens digitalizadas de texto de volta para arquivos de texto.
-
CLARA é outra boa opção gráfica.
-
OCRAD de é um OCR pode ser usado como um aplicativo de console independente ou como um back-end para outros programas.
-
KOOKA de é uma aplicação do KDE, mas funciona bem, além disso tem de instalar programas OCR reais como GOCR e OCRAD. Depois de instalar o Kooka e os programas OCR, tem de apontar o Kooka para o local de instalação do OCR para poder converter o JPEG para texto.
-
OCRFeeder de é uma análise de layout de documentos e sistema de reconhecimento óptico de caracteres.
-
Tesseract de é o utilitário de linha de comando e é muito simples de usar. Você pode instalar o pacote de idiomas tesseract-ocr-eng de < a href="http://apt.ubuntu.com/p/tesseract-ocr-eng"> aqui .
Dê uma olhada nesta página .
Nota:
Para executar o terminal goto tesseract e digite o seguinte
tesseract imagefile.tif outputfile.txt
O Tesseract só pode ler um arquivo TIFF - se você tiver um arquivo JPEG ou PDF ou qualquer outra coisa, terá que convertê-lo. Além disso, a extensão do nome do arquivo deve ser .tif, não .tiff, caso contrário, os erros do tesseract são eliminados.