Perguntas sobre 'ocr'

Questões relacionadas ao reconhecimento óptico de caracteres (ocr)
2
respostas

Abbyy bom leitor como aplicativo para o Ubuntu 13.04

Eu tenho muitas imagens e o que eu quero fazer é digitalizar essas imagens e obter uma saída em um arquivo ms que pode ser editado depois. Para o Windows, tenho o bom leitor Abbyy. Mas eu não quero voltar para o Windows. Por favor, diga-me se ex...
19.05.2013 / 09:52
0
respostas

Como adicionar texto oculto ao pdf original em gscan2pdf? [fechadas]

Eu sou novo no gscan2pdf 0.9.31 e apenas o usei para o OCR em um pdf digitalizado. Depois de salvar o pdf, o texto oculto é armazenado no canto superior esquerdo. No entanto, desejo que cada caractere com OCR seja adicionado exatamente ao local...
10.05.2011 / 03:56
0
respostas

Imagens de conversão pdf para texto

Eu tenho uma verificação de 500 páginas em pdf de um livro do século XV. Eu quero convertê-lo em um único arquivo txt de qualquer formato, para poder trabalhar nele e / ou exportá-lo para epub. O Caliber não consegue processá-lo. Eu tentei...
18.05.2017 / 14:08
1
resposta

Como eu evito que o hocr2pdf use uma fonte grande do arquivo .hocr gerado pelo tesseract?

O Tesseract agora cria um arquivo .hocr em vez de um arquivo .html para a saída ocr, mas isso não é exatamente o que está em questão aqui. Quando o hocr2pdf usa essa saída, ele usa um tamanho de texto grande com caixas delimitadoras pequenas des...
02.07.2014 / 21:23
3
respostas

Como extrair instantaneamente texto de uma área de tela usando ferramentas de OCR?

No Ubuntu 12.10, se eu digitar gnome-screenshot -a | tesseract output retorna: ** Message: Unable to use GNOME Shell's builtin screenshot interface, resorting to fallback X11. Como posso selecionar um texto da tela e convertê-lo em...
12.04.2013 / 00:11
1
resposta

Conversão da imagem tiff no script Python - OCR usando o Tesseract

Eu quero converter um arquivo de imagem tiff para documento de texto. Meu código funciona como eu esperava para converter imagens tiff com fonte usual, mas não está funcionando para fonte de script francês. Meu arquivo de imagem tiff contém text...
18.05.2013 / 11:47
2
respostas

convertendo djvu para problemas de pdf com este código de preservação de OCR

Eu quero converter o djvu para pdf preservando o OCR. Esta página descreve como fazer isso, mas estou obtendo um arquivo html em branco. Em / home / steven / Documents / djvu2pdf / 1 /, djvu2hocr -p 1 Intro.djvu me dá: Converting 'Int...
25.03.2013 / 09:34
9
respostas

Como extrair texto com OCR de um PDF no Linux?

Como extraio texto de um PDF que não foi criado com um índice? É tudo texto, mas não consigo pesquisar nem selecionar nada. Estou executando o Kubuntu e o Okular não tem esse recurso.     
24.08.2009 / 00:34
4
respostas

Como criar PDF com páginas digitalizadas, mas texto selecionável?

Hoje recebi um PDF de nosso fornecedor e ele continha várias páginas impressas e digitalizadas com assinaturas, etc. Abri-o no Acrobat Reader DC. Mas, para minha surpresa, o texto das imagens evidentemente digitalizadas podia ser selecionado e c...
09.02.2018 / 10:16
8
respostas

Como posso converter imagens digitalizadas como PDF em um arquivo PDF pesquisável? [fechadas]

Eu tenho um PDF de um livro digitalizado. Estou procurando um software gratuito que execute o OCR e, em seguida, ofereça uma opção para salvá-lo como PDF ou documento novamente. Existe um?     
04.10.2009 / 06:36