Perguntas sobre 'ocr'

Questões relacionadas ao reconhecimento óptico de caracteres (ocr)
1
resposta

Como posso rasterizar todo o texto em um PDF?

Você sabe quando você tem um pdf, que é uma digitalização de um documento e é realmente um arquivo enorme, porque ele apenas armazena a imagem do documento digitalizado? E existem ferramentas de OCR que podem ajudá-lo a criar um documento ade...
26.04.2015 / 16:09
4
respostas

Existe algum tipo de PDF para o conversor de texto?

Eu preciso de arquivos PDF para texto, para que eu possa pesquisá-los em massa a partir da linha de comando. Existe algum conversor para Ubuntu, OBSD ou distro similar? Talvez um post relacionado, OCR com o ubuntu aqui .     
11.12.2010 / 15:46
1
resposta

Onde posso obter binários do Tesseract para o Debian 6 64bit?

Eu usei o apt-get para instalar o Tesseract, mas ele não está realmente funcionando. Talvez eu pudesse simplesmente baixar binários em algum lugar, colocar em um diretório e usar dessa maneira? O que há de errado com o meu Tesseract agora:...
23.01.2015 / 23:05
0
respostas

OCR que produz dados de probabilidade

Eu gostaria de converter os livros impressos que possuo em áudio, digitalizando-os com OCR e, em seguida, executando o texto por meio de um mecanismo TTS. Esses títulos não estão disponíveis como e-books. Como o OCR pode gerar pequenos erros,...
27.09.2013 / 18:17
2
respostas

Como atualizo esta busca recursiva de arquivos de diretórios para entradas e saídas de nomes para lidar com o caso abaixo

Estou atualizando um script que recursivamente passa por um diretório e ocorre no pdf e atualiza o pdf. Na sua versão simples, funciona. ocrmypdf -l vie --deskew --clean --force-ocr --sidecar vietnamese_website.txt Vietnamese\ Website.jpg...
26.09.2018 / 04:45
0
respostas

Extrair legendas codificadas

Eu queria saber se existe uma maneira de extrair legendas codificadas via OCR, devo fazer algum processamento de imagem depois de extrair os quadros para usar tesseract depois? Eu tentei extrair quadros do vídeo e remover tudo o que não é...
18.07.2018 / 01:38
0
respostas

OCR para obter texto de uma imagem. Gerenciamento de erros

Eu quero usar um programa de OCR para obter algum texto em uma imagem. O texto não é preto sobre branco, então não sei se será possível. wget -q -O image http://4.bp.blogspot.com/-mIE4JlppKMU/T9_mxKR__wI/AAAAAAAAASs/deHLBL21ZbE/s640/Temple%20...
28.12.2014 / 00:28
2
respostas

OCR software para equações para obter o arquivo LaTeX

Primeiro, peço desculpas se este não é o lugar certo para perguntar isso, mas não consegui pensar em nenhum outro lugar (talvez o Stack Overflow?). De qualquer forma, estou procurando um software de reconhecimento óptico de caracteres (OCR) p...
18.12.2016 / 18:59
1
resposta

Imagem (com texto e números) para correspondência de arquivo de texto [: alnum:] bem com algum Unix -tool?

Suponha uma fotografia com texto e números. Eu quero gerenciá-lo no meu editor com ferramentas como o grep, coisas de processamento de texto padrão, como o realce de bloco do Vim e também coisas mais avançadas, como o realce do padrão de varinha...
26.05.2011 / 01:57
1
resposta

Escrevendo a uma figura que é um documento varrido

Eu tenho um contrato digitalizado e preciso alterar apenas alguns nomes e datas no contrato. É fácil digitalizar o documento, mas é impossível ocr o documento e abrir no formato * .doc. Existe um aplicativo capaz de alterar de maneira conf...
19.04.2011 / 11:29