Instala o tesseract ocr 3 no OSX

0

Estou tentando instalar o Tesseract OCR no OSX 10.6 ...

Eu consegui instalar o leptonic (por download src e instalar com ./configure; make; sudo make install ) aparentemente sem problemas - mas eu não sei como checar.

Eu também instalei o Tesseract OCR 3 (do Google Code com ./runautoconf; ./configure; make; sudo make install ) também aparentemente sem problemas - mas novamente não sei como verificar.

Quando executo o tesseract input.jpg . , recebo o erro ...

 bash-3.2$ tesseract ~/Desktop/DCIM/101_FUJI/DSCF1043.JPG . 
 Tesseract Open Source OCR Engine with Leptonica
 Error in pixReadStreamJpeg: function not present
 Error in pixReadStream: jpeg: no pix returned
 Error in pixRead: pix not read 
 Error in fopenReadStream: file not found 
 Error in pixRead: image file not found
 Image file ######
 Exif cannot be read! 

Erro semelhante se eu usar o arquivo tiff como entrada.

Eu acho que preciso de algumas bibliotecas - instruções para o Ubuntu dizer para instalar o libjpeg12-dev etc ...

Alguém tem detalhes de como instalar o tesseract no OSX?

    
por Billy Moon 20.09.2011 / 19:51

3 respostas

2

Instale o macports: consulte link para downloads e instruções de instalação.

Atualize a árvore de ports: sudo port selfupdate

Instale o tesseract: sudo port install tesseract

A porta do tesseract não parece ter uma variante que suporte o jpeg, portanto você precisaria instalar um conversor de arquivos gráficos e um pacote de ajuste de imagem (brilho, contraste e nitidez): sudo port install imagemagick

Converta seu jpeg para o formato tiff e execute o OCR nele com tesseract: convert input.jpg input.tiff ; tesseract input.tiff ocr-text-ouput -l eng ; rm input.tiff

O texto resultante deve ser encontrado no arquivo ocr-text-ouput.txt.

p.s. você pode ajustar um pouco a imagem para uma experiência de OCR potencialmente melhor com opções de conversão como estas: convert -sharpen 1 -brightness-contrast 3X30 input.jpg input.tiff

    
por 07.01.2012 / 14:48
2

Estou usando o homebrew no osx 10.7 e foi tão simples quanto rodar esses dois comandos:

brew install leptonica
brew install tesseract

Isso instalou leptonica 1.68 e tesseract 3.01 com suas dependências

    
por 05.06.2012 / 22:37
0

Trabalhando com uma solução de comando para mim:

sudo brew install tesseract

Isso instala o tesseract e todas as dependências. sudo necessário para alguns fins, como jpeg packet linking.

    
por 10.02.2014 / 12:57