Como obtenho a captura de tela da melhor qualidade para OCR (Optical Character Recognition)?

2

Estou tentando coletar alguns dados em um arquivo de texto a partir de capturas de tela. Aparentemente screenshots não funcionam muito bem com o OCR porque são 75dpi e o mínimo para OCR de boa qualidade é de 150dpi. Alguém sabe uma boa maneira de tirar screenshots para o OCR?

Neste momento, estou obtendo ótimos resultados com as ferramentas on-line gratuitas, como new-ocr , mas ele comete erros que tenho para corrigir de vez em quando. Então eu gostaria de algumas dicas.  Eu também testei a captura de tela do ABBYY e foi muito ruim ... as ferramentas on-line são melhores.

    
por GiH 06.03.2010 / 02:25

5 respostas

1

A partir de 21 de junho de 2011, você poderá usar o Google Docs em capturas de tela do OCR em lote.

Você pode fazer upload de uma pasta de imagens e convertê-las em Documentos, que conterão a imagem e o texto oculto.

Você pode fazer o download em lote de todos esses documentos como texto simples, o que removerá a imagem.

Se suas capturas de tela tiverem nomes de arquivos exclusivos, deve ser trivial vinculá-las ao texto com OCR em praticamente qualquer sistema.

    
por 21.06.2011 / 23:50
4

Eu tive uma necessidade semelhante recentemente (não para captura de tela, mas para a página enviada por fax). Ocrterminal.com fez um ótimo trabalho, é rápido e gratuito para um determinado número de conversões por mês (acho que 20?). Um amigo usa o Tesseract , que é baseado em linha de comando e parece funcionar bem também.

    
por 11.04.2010 / 04:35
1

ScreenOCR (teste de 21 dias) afirma fazer um bom trabalho com capturas de tela (o que ajuda você a fazer). Eu não tentei embora.

    
por 11.04.2010 / 02:52
0

Eu diria que, como as capturas de tela estão usando uma fonte, em vez de manuscrito, executá-las a 75 dpi não seria tão ruim assim.

    
por 06.03.2010 / 03:26
0

Eu uso GreenShot para capas de tela

    
por 06.03.2010 / 18:57