Como extrair texto de um pdf baseado em imagem usando o Cuneiform no terminal

0

cuneiform -l eng -f text -o outocr.txt input.pdf

O comando acima, quando executado no terminal, exibe apenas o texto da minha página de título do PDF para o arquivo outocr.txt. O que devo fazer para reconhecer todo o texto no PDF de 120 páginas? Eu estou usando o Fedora Linux 25 (x86_64).

    
por codezombie 31.01.2017 / 10:27

1 resposta

2

Esta postagem fornece um exemplo de script para ler muitas páginas individuais e criar um PDF de várias páginas. Cuneiform por si só não cria documentos de várias páginas. Como extrair texto com OCR de um PDF em Linux?

    
por 15.08.2017 / 17:37