Converter texto em arquivo de imagem para arquivo de texto

0

Eu tenho um arquivo PDF que é uma digitalização de um formulário contendo imagens, tabelas e texto.

Eu gostaria de executar um programa (não uma ferramenta online) no arquivo e fazer com que ele produza um arquivo txt contendo as palavras. Não muito preocupado com a formatação.

Observe que isso não é uma repetição de 'Converter PDF em texto ignorando estrutura', pois isso se refere ao texto em documentos PDF retos, e não a imagens digitalizadas armazenadas como PDF.

    
por FrinkTheBrave 29.07.2014 / 10:16

1 resposta

0

Se os autores não tiverem acesso ao arquivo de origem e à ferramenta de criação, o PDF digitalizado poderá ser convertido em documento do Word usando reconhecimento óptico de caracteres (OCR). OCR PDF pode então ser usado para converter PDF para documentos de palavra acessíveis e pesquisáveis.

    
por 31.07.2014 / 11:58

Tags