Como exportar uma tabela de dentro de um PDF para uma planilha?

2

Eu quero converter este PDF que contém uma tabela, em uma planilha compatível com Excel para o fins de fazer cartões de memória flash.

Alguém sabe de uma maneira automática de fazer isso sem copiar manualmente cada frase para a coluna correta?

    
por Chris 03.12.2014 / 16:01

3 respostas

2
  1. O formato PDF de sua criação (há mais de 20 anos) nunca foi planejado para ser um host extraível, estruturado de forma significativa dados .

  2. Seu propósito original era ser uma representação visual confiável de texto, imagens e diagramas em um documento - um tipo de papel digital (que também seria confiavelmente transferido para papel real via impressão). Apenas mais tarde no seu desenvolvimento foram adicionados mais recursos, entre os quais alguns que devem ajudar na extração de dados novamente (google para Tagged PDF ).

  3. Para alguns exemplos de problemas que são colocados nas tabelas de raspagem de dados dos PDFs, consulte este artigo:

  4. Contradizendo meu ponto '1.' acima , agora digo isto: para uma incrível família de ferramentas que fica melhor e melhor de semana para semana para extrair dados tabulares de PDFs (a menos que sejam páginas digitalizadas), veja estes links:

Então: vá procurar por Tabula. Se alguma ferramenta puder fazer o que você quer, neste momento (4 anos depois que esta pergunta foi feita), Tabula está provavelmente entre os melhores para o trabalho!

P.S .: O Tabula é um software livre e de código aberto, escrito em Ruby.

    
por 03.12.2014 / 19:19
1

Converta arquivos PDF em documentos do Microsoft Excel, extraia tabelas. Este conversor PDF gratuito e criador PDF é rápido e confiável. Espero que isso tenha sido útil

link

    
por 03.12.2014 / 16:17
1

Eu sei que este é um post antigo, mas há muitas ferramentas gratuitas que você pode usar para conversões únicas. Aqui estão alguns exemplos:

Você encontrará muito mais se pesquisar por PDF Table to Excel no Google.

    
por 09.10.2017 / 13:45