copia uma tabela do pdf como uma tabela?

5

Como posso copiar ou exportar uma tabela de um documento PDF para Word, Excel, OneNote, etc. como uma tabela em vez de texto simples?

Exemplo em pdf: ftp://ftp2.cits.rncan.gc.ca/ pub / canvec / doc / CanVec_transition_guide_en.pdf , a partir da página 9. Estou usando o Office 2003, OneNote trial 2007.

    
por matt wilkie 09.07.2010 / 01:50

8 respostas

4

Você pode tentar Tabula - funciona muito bem para conteúdo orientado a dados colocado em tabelas.

Uma breve introdução pode ser encontrada na página inicial.

Usando a ferramenta para o PDF anexado a essa pergunta, você precisa:

  1. Faça o download do arquivo para seu disco local.
  2. Instale e inicie a ferramenta seguindo as instruções na página inicial.
  3. Carregue o PDF e selecione Enviar .
  4. Navegue até a primeira tabela e selecione a tabela. Certifique-se de não selecionar o cabeçalho e o rodapé da página para obter um resultado mais preciso.
  5. EscolhaRepetirestaseleçãosequiserselecionarastabelasaseguirusandoasmesmascoordenadas.
  6. EscolhaFazerodownloaddetodososdadosereceba.
  7. Escolha Fazer o download de dados para obter um arquivo CSV com as tabelas extraídas. Este arquivo pode ser aberto com o MS Excel ou qualquer outro aplicativo que possa ler o formato CSV para processamento adicional.
por 14.04.2014 / 17:06
5

Você pode usar o visualizador de documentos do Okular disponível no Linux e Windows através do link instalador.

Ele pode selecionar o texto como uma tabela, onde você pode definir linhas e colunas.

    
por 22.08.2012 / 13:29
4

MirzaD, obrigado por sugerir o Okular. Eu tenho isso instalado no meu desktop Ubuntu, e nunca levou a sério .. até agora. Graças à você.

Okular is awesome nos recursos que ele contém, e certamente pode atender às necessidades do cara que fez a pergunta. Com o Okular, você usa um Table Selection Tool e define uma área e, em seguida, clica nas bordas da coluna para marcar os campos .. e, em seguida, copia. Ao colá-lo, você obtém uma saída consistente delimitada por tabulação que qualquer ferramenta séria pode ser persuadida a manipular como um arquivo CSV.

Eu tenho essa necessidade (para extrair algumas tabelas de um documento PDF) agora em um desktop Centos rodando o gnome / xfce, e instalar o okular significaria instalar um monte de outras ferramentas gráficas do KDE. Então, vou tentar primeiro com tabula (que parece muito promissor também), e se isso falhar, então okular teria que ser.

Isso funcionaria para o Windows? Sim, o KDE pode ser instalado no Windows, mas os aplicativos do KDE vêm com uma sobrecarga decente de outros softwares desnecessários. Então, depende de quão grandes são as suas necessidades, isso pode ser uma opção viável para até mesmo janelas.

Leia mais sobre o Okular aqui .. e seu slogan More Than a Reader certamente se encaixa .. Estou realmente impressionado com o que o Okular pode fazer .. em um aplicativo limpo e rápido o suficiente com uma pegada pequena.

O

projeto do KDE para Windows facilita a instalação de um subconjunto de excelentes aplicativos do KDE no Windows.

    
por 22.04.2014 / 05:48
2

Abra o documento com o Adobe Acrobat. Clique em Arquivo > Salvar como. Selecione "HTML 4.01 com CSS 1.0 (* .htm, * .html)" em "Salvar como tipo" e salve.

Você pode abrir o arquivo HTML salvo no Microsoft Word e ele será exibido como uma tabela em vez de texto sem formatação.

    
por 09.07.2010 / 02:36
2

www.freepdftoword.org - serviço online gratuito. Faz um trabalho confiável de criar objetos de tabelas verdadeiras no Word.

    
por 09.07.2010 / 22:19
1

Isso é difícil. Se você tiver os meios, a solução mais fácil será entrar em contato com a pessoa que fez o PDF. As chances são de que eles fizeram de um arquivo. Doc. Se você conseguir o original, você tem o que precisa sem necessidade de conversão.

    
por 09.07.2010 / 18:43
1

A related Q&A has been, apparently, deleted: https://stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800 (see cached version: http://webcache.googleusercontent.com/search?q=cache:9I328EN_d64J:stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800+&cd=1&hl=en&ct=clnk&gl=ch).

Below my answer, re-confirming that Okular is an excellent choice for a quick scrapping action.

Para uma (s) extração (ões) rápida (s) de tabela, vale a pena conferir a excelente ferramenta de seleção de tabelas do Okular.

  1. Abra o arquivo PDF e localize a tabela em questão
  2. ative a Ferramenta de Seleção de Tabela com Ctrl + 5
  3. desenhe uma área retangular para incluir a tabela
  4. finalmente, e se necessário, defina as divisões vertical e horizontal das células da tabela clicando nas bordas (talvez seja necessário brincar um pouco para obter a ideia - veja a imagem abaixo).

Voila! Copie e cole, por exemplo, em uma planilha vazia.

    
por 09.05.2016 / 11:47
0

Não gosto de adicionar software extra ou enviar meus dados para um site externo para convertê-los. Geralmente por causa do aspecto do tempo!

Mas no PDF você pode selecionar dados em colunas mantendo pressionada a tecla Alt e arrastando, enquanto sua tabela não é grande (ou seja, você terá que fazer isso para cada coluna). Basta copiar e colar cada palavra.

Não é o ideal, mas funciona sem ter que instalar nada extra!

    
por 22.08.2012 / 13:37