Dividir a imagem do texto em palavras - é possível?

Question

Dividir a imagem do texto em palavras - é possível?

0

Eu estou querendo saber se existe uma maneira de dividir uma cópia digitalizada de uma página (ou seja, uma imagem) em imagens de suas palavras constituintes. O livro que está sendo escaneado está em uma língua indiana para a qual o OCR (Optical Character Recognition) não funcionaria.

O objetivo é ter uma versão digital do livro (no mesmo idioma) e, para isso, eu estava pensando em fazer o seguinte -

digitalize o livro
divida o conteúdo de uma página em suas palavras constituintes
envia as imagens das palavras para os transcritores que podem digitar a palavra na imagem
remontar as palavras em cada página

Como a correspondência entre imagens e imagens é razoavelmente boa, imagens das mesmas palavras podem ser identificadas e, portanto, não precisariam ser transcritas repetidamente.

Qualquer ajuda seria ótima!

pdf image-processing ocr image-editing

por user1993 22.08.2018 / 00:01

0 respostas

Tags pdf image-processing ocr image-editing

Excel - Como obter o número de células e adicionar uma palavra a ele? ou seja, KO1, KO2, etc Editores de texto Anexando texto ao salvar quando caracteres excluídos