Esta postagem fornece um exemplo de script para ler muitas páginas individuais e criar um PDF de várias páginas. Cuneiform por si só não cria documentos de várias páginas. Como extrair texto com OCR de um PDF em Linux?
cuneiform -l eng -f text -o outocr.txt input.pdf
O comando acima, quando executado no terminal, exibe apenas o texto da minha página de título do PDF para o arquivo outocr.txt. O que devo fazer para reconhecer todo o texto no PDF de 120 páginas? Eu estou usando o Fedora Linux 25 (x86_64).
Esta postagem fornece um exemplo de script para ler muitas páginas individuais e criar um PDF de várias páginas. Cuneiform por si só não cria documentos de várias páginas. Como extrair texto com OCR de um PDF em Linux?