Ocr não reconhece uma imagem específica [fechada]

-1

Estou procurando fazer essas imagens , (8 , 0) reconhecido por um Ocr
Estou usando tesseract, mas eu não me importo se outro OCR torná-lo

    
por MRTgang 16.12.2015 / 18:24

1 resposta

1

Devemos chamar o tesseract com a opção -psm <N> para a configuração da página:

0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR.
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.

As opções de interesse são 10 e 6 , caso tenhamos apenas um único caractere em nossa origem de bitmap.

Ao renderizar a fonte de imagem cinza da seguinte forma

tesseract LO1v5.png -psm 6

obteremos um resultado correto de 8 , mas a fonte de imagem verde é muito importante desafio para tesseract que é especializado em textos inteiros, em vez de números.

Melhorando a qualidade de entrada

teremos melhores resultados ao chamar o tesseract no modo de reconhecimento de caractere único:

tesseract sourceimage -psm 10

Isso nos dará um palpite correto de 8 , mas apenas uma estimativa quase correta de B para a 0 -image.

    
por Takkat 16.12.2015 / 20:42