Você pode usar o seguinte link para saber mais sobre como treinar o tesseract. Para corrigir os arquivos da caixa, você pode usar o jTessBoxEditor . Tenha em mente que, às vezes, você pode precisar pré-processar as imagens.
Eu não entendo como devo dizer à Tesseract que isso é na verdade a b c
letras?
Anexando o makebox em cli, produziu este arquivo:
C 78 127 104 166 0
l 96 127 118 166 0
. 116 127 126 140 0
- 124 127 130 145 0
j 145 127 162 188 0
o 154 127 183 158 0
b 203 131 241 164 0
Você pode usar o seguinte link para saber mais sobre como treinar o tesseract. Para corrigir os arquivos da caixa, você pode usar o jTessBoxEditor . Tenha em mente que, às vezes, você pode precisar pré-processar as imagens.
Tags tesseract-ocr