Como posso fazer com que o Tesseract OCR reconheça os dígitos grandes de um medidor de eletricidade?

0

Eu quero usar um programa de OCR em um RPi para reconhecer os dígitos de uma foto do meu medidor de energia elétrica. Os dígitos são grandes e são muito óbvios para mim, mas o Tesseract parece incapaz de reconhecê-los - na melhor das hipóteses, detecta alguns dígitos aleatórios errados.

Eu tentei cortar os números e fazer o OCR individualmente, mas isso não ajuda. Eu tentei alguns outros programas de OCR e eles não eram melhores.

Por favor, você pode dar alguma sugestão de como eu posso fazer com que o Tesseract identifique corretamente os 2 números grandes na imagem abaixo? Observe que a imagem original é ~ 2.5MB - esta cópia é menor para caber neste site.

    
por Shaka Zulu 07.08.2017 / 22:13

1 resposta

1

Números muito pequenos são mais fáceis de ler quando são iluminados por uma fonte de luz strong. Alguns dispositivos de hardware, como unidades flash e adaptadores de energia, possuem uma gravação muito pequena impressa na caixa de plástico, que é muito difícil de ler em uma luz suave, mas fácil de ler quando o dispositivo é iluminado por uma fonte de luz strong.

Se isso não funcionar, você poderá abrir a imagem a ser digitalizada no GIMP Image Editor e aprimorar o brilho e o contraste antes de fazer o OCR. O GIMP Image Editor está disponível nos repositórios padrão do Ubuntu.

  1. Selecione uma área retangular da imagem que contém os números a serem digitalizados usando a Ferramenta de Seleção de Retângulo, localizada no canto superior esquerdo da Caixa de Ferramentas.

  2. No menu do GIMP, selecione Cores - > Brilho-contraste .

  3. Mova os controles deslizantes Brilho e Contraste para melhorar a legibilidade dos números.

  4. Verifique se a cor do primeiro plano, localizada na parte inferior central da Caixa de ferramentas, está em preto, que é a cor padrão.

  5. Use a ferramenta Preenchimento de caçamba para preencher o plano de fundo dos números com a cor preta, para que os números de cores claras apareçam com maior contraste em relação a um fundo preto.

  6. Selecione outra área retangular da imagem que contenha números a serem verificados, se necessário, e repita as etapas 2-5.

  7. Exporte sua imagem quando terminar de editá-la usando Arquivo - > Sobrescrever ou Arquivo - > Exportar como…

Você pode ver os resultados da verificação de OCR obtidos usando o GIMP para melhorar minha imagem de teste em esta resposta .

    
por karel 08.08.2017 / 06:31