Extrair texto da imagem

2

Estou procurando um software que reconheça o texto dentro das imagens. Eu tentei todas as ferramentas mencionadas aqui (gocr, fuzzyocr, libhocr0, ocrad, ocrfeeder, ocropus, tesseractocr, cuneiforme). Minha opinião foi uma fotografia de um documento impresso, portanto, não escrevendo à mão, apenas letras impressas. De todas as ferramentas, o tesseract-ocr é o mais preciso em meus testes, mas ainda produz muitos erros. Assim, a digitalização de um documento para algum arquivo de imagem e a continuação da indexação ou a execução de alguma PNL, infelizmente, não é uma opção. A taxa de erro é muito alta.

Então, dada a idade da publicação acima mencionada, existem ferramentas melhores para extrair texto de imagens ou fotografias?

EDIT 1:

Com "imagem contendo texto" quero dizer, que eu tenho um arquivo PNG / JPG / BMP como uma fonte e que eu quero extrair o texto pixelizado dentro dele e ter um texto ASCII / UTF-8 como resultado e saída.

    
por Socrates 18.05.2017 / 17:54

0 respostas