Perguntas sobre 'ocr'

Questões relacionadas ao reconhecimento óptico de caracteres (ocr)
5
respostas

Como usar o OCR da linha de comando no Linux?

Eu tenho milhares de páginas de páginas de livros digitalizadas. Cada página é salva individualmente como um JPG. A escrita é clara, mas as fontes variam e as páginas incluem fotos e ilustrações. Eu preciso criar uma lista de todas as palavra...
09.07.2017 / 23:22
5
respostas

OCR em sistemas Linux [fechado]

Eu sempre achei que a tecnologia OCR estava por trás dos sistemas de código aberto. Também assisti ao projeto Ocropus desde a sua infância. Eu tentei o que eu ouvi é o melhor mecanismo de OCR disponível para Linux, Tesseract , e encontrei-o...
17.08.2010 / 00:27
3
respostas

como OCR um arquivo pdf e obter o texto armazenado em pdf?

Primeiro, desculpe se isso foi solicitado antes - procurei por um tempo nas postagens existentes, mas não consegui encontrar suporte. Estou interessado em uma solução para o Fedora para o OCR de um pdf multivariavel não pesquisável e para tra...
04.08.2016 / 17:39
3
respostas

sed one-liner para substituir maiúsculas da palavra-medial

Eu usei o OCR para transformar algumas digitalizações em texto simples, mas infelizmente as letras 'fi', que são comumente associadas a algumas fontes, foram lidas como maiúsculas. Agora eu preciso substituir todos os W's por 'fi', e estes podem...
27.05.2011 / 01:47
1
resposta

tesseract: é possível alterar a saída da fonte no pdf OCRed?

Acompanhamento de Como fazer o OCR de um arquivo pdf e obter o texto armazenado em pdf? Produzi com sucesso páginas pdf em OCR. Em Evince, no entanto, as letras não são mostradas; por isso quero dizer que não consigo ver os personagens, mas...
27.08.2016 / 10:14
1
resposta

De-ofuscar uma imagem com informação estatística?

Eu preciso colocar esse tipo de informação em números, como? Talvez relacionado link link BiOps de R aqui como uma ferramenta genérica. O PET de R tem Hough transforma aqui (mas pode não funcionar neste domínio, mas...
04.02.2012 / 19:01
0
respostas

Excluir o OCR do PDF

Eu tenho um arquivo PDF contendo OCR corrompido. É um monte de páginas manuscritas com muitos símbolos e abreviações, e eu recebi este arquivo com um OCR gerado automaticamente. Como posso remover a camada de texto para obter um arquivo mais cla...
12.06.2017 / 00:46
2
respostas

Crie uma lista de palavras personalizada

Eu quero criar uma lista personalizada de palavras (científicas) para fins como verificação ortográfica e OCR com base na minha coleção de artigos científicos em formato pdf. Usando pdftotext eu posso criar facilmente um arquivo de texto que...
18.05.2013 / 22:25
2
respostas

Como encontrar todas as imagens que contenham algum texto?

Tenho muitas imagens e preciso encontrar quais delas contêm qualquer texto em inglês (para excluí-las). É possível fazer isso automaticamente?     
17.10.2012 / 11:59
1
resposta

Linux equivalente do GraphClick?

Existe um software Linux que faz o GraphClick no Mac OS X? Ou seja, existe um software Linux que "é um software de digitalizador gráfico que permite recuperar automaticamente os dados originais (x, y) da imagem de um gráfico digitalizado"?...
29.04.2011 / 17:30