OCR para imagens de baixa qualidade

1

Infelizmente, isso não é CSI, nós coletamos 20.000 imagens para placas de licença; Estávamos nos perguntando se existe uma maneira confiável de ler essas placas usando o OCR. as imagens especialmente noturnas são extremamente de baixa qualidade.

    
por dassouki 18.05.2010 / 02:08

3 respostas

2

O Tesseract é o melhor software de OCR (gratuito) que usei. Eu usei para documentos em papel digitalizados, mas também pode funcionar para placas de veículos.

Você precisaria converter todas as imagens em TIFFs, se elas já não estiverem nesse formato.

    
por 18.05.2010 / 02:31
2

A maioria dos pacotes de OCR prontos para uso são projetados para reconhecer texto de documentos digitalizados ou semelhantes e esperam um alinhamento de texto, ângulo de visão e configurações de contraste razoáveis.

Você provavelmente precisará fazer um pré-processamento em suas imagens para (a) detectar e cortar a área da imagem que contém a placa, (b) executar correção de perspectiva e opcionalmente (c) aprimoramentos de contraste e ruído para a tiros noturnos.

    
por 18.05.2010 / 03:16
1

Você pode ter melhores resultados com as imagens se as pré-processar para remover o ruído usando algo parecido com essa ferramenta:

Noise Ninja na PictureCode

Eu encontrei referências a plugins de código aberto para a popular ferramenta GIMP se uma solução comercial não for aceitável para você, mas eu nunca fui um grande fã dessa ferramenta (GIMP) pessoalmente.

    
por 09.07.2010 / 08:51

Tags