Como transformar uma imagem em um documento formatado rico?

2

Então eu tenho uma revista (com algumas páginas) em mãos e eu quero ter um arquivo resultante que manterá todo o diagrama e imagem intacta, mas ainda permitir que eu procure / encontre e selecione texto nele.

Este PDF é um pequeno exemplo de um resultado que desejo ter. Até o título é selecionável! Parece ter sido criado para PDF em vez de digitalizado, mas você tem a idéia.

O arquivo resultante não precisa ser PDF, embora eu duvide que exista um formato melhor para isso. O documento precisa ser um arquivo (para leitura off-line) e compatível com a plataforma cruzada.

Existe qualquer (simples) solução para isso? Se não, como eu poderia, pelo menos, fazer o trabalho do OCR manualmente?

    
por cregox 28.06.2013 / 20:02

1 resposta

2

Edit: @Cawas relata que visualizador do PDF-Exchange realizou a tarefa com sucesso, executando o OCR em um PDF e torná-lo pesquisável.

Para as necessidades que você listou, o PDF é provavelmente a mais simples e a mais multiplataforma. Outra alternativa, um pouco mais obscura, é o formato DJVU, mas ao contrário do PDF, há muito menos suporte para eles, especialmente em termos de OCR.

Há um número de software gratuito de reconhecimento óptico de caracteres disponíveis e fáceis de usar. No entanto, se você estiver procurando por uma solução muito simples, qualquer documento PDF carregado no Google Drive terá automaticamente OCR realizado nele . Há limitações nisso, mas deve funcionar para documentos curtos.

    
por 28.06.2013 / 21:54