Como os dados deste PDF podem ser obtidos em texto simples?

1

Em este arquivo a partir da página 5, um número de linhas de dados são gravadas. Eu preciso dessas linhas no formato de texto simples. Como posso extraí-los?

    
por TMOTTM 25.02.2013 / 15:09

3 respostas

2

Você pode converter o conteúdo de um PDF em texto sem formatação utilizando pdftotext .

Basta executar pdftotext Appendix.pdf e ele vai cuspir um Appendix.txt em todos os textos sem formatação.

    
por 25.02.2013 / 15:25
4

O que há de errado em simplesmente copiá-los?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814
    
por 25.02.2013 / 15:14
0
  1. Salvar documento na máquina local.

  2. O
  3. link converterá o pdf em Word. Documentos maiores só podem ser parcialmente convertidos, então você pode ter que convertê-lo em blocos.

  4. No Word '07, Arquivo - > Opções - > Avançado - > "Colando no documento" e "colando entre documentos", defina como "manter apenas o texto".

  5. Corte / cole dados em um documento em si mesmo, recorte / cole de outros documentos no primeiro documento.

Depois disso, você deve ter 1 documento grande em texto simples.

    
por 25.02.2013 / 15:35