Você precisa extrair o texto com o programa de reconhecimento óptico de caracteres (OCR). Isso deve fornecer uma visão geral do que está disponível no link do linux.
Eu tenho um livro digitalizado como imagens compactado em um arquivo PDF e quero manter o livro como está , mas gostaria de extrair o texto das imagens, para que seja possível selecioná-lo / copiá-lo.
Existe uma maneira de fazer isso no Linux?
Você precisa extrair o texto com o programa de reconhecimento óptico de caracteres (OCR). Isso deve fornecer uma visão geral do que está disponível no link do linux.
Tags pdf image-manipulation