Extrai dados de um arquivo de texto muito confuso para o Excel [closed]

0

Eu tenho um arquivo .txt muito confuso com muitos dados não processados. É uma grande linha longa, repetindo constantemente os dados de localização:

\"Locations\":[{\"lat\":\"37.77160263061523\",\"lng\":\"-120.85061645507812\",\"city\":\"Oakdale\",\"poi\":\"\",\"pindata_id\":\"194395\"}]},{\"User\":{\"id\":\"<censored>\",\"username\":\"<censored>\"},\"Pindata\":{\"id\":\"194739\",\"date\":\"2018-05-18\",\"country\":\"US\",\"title\":\"Let's go!\"} ... e depois repete isso várias vezes

Agora, o que eu quero é um script ou ferramenta que extraia todos os dados desse tipo nas colunas e células do Excel. Então, da (s) linha (s) acima, para fazer assim:

Latitude            Longitude             City      Date         Title
37.77160263061523   -120.85061645507812   Oakdale   2018-05-18   Let's go!
etc.
etc.

Como eu faria algo assim?

    
por Gerlof Leuhof 12.09.2018 / 23:28

3 respostas

1

Abra o arquivo de texto em um editor com capacidade de regex (Emeditor, BBedit, etc ...) e faça a seguinte pesquisa regex:

.+lat\":\"(.+)\",\"lng\":\"(.+)\",\"city\":\"(.+)\",\"poi.+date\":\"(.+)\",\"country.+title\":\"(.+)\"\}

E substitua por:

$1\t$2\t$3\t$4\t$5

Isso fornecerá um arquivo delimitado por tabulação, que você poderá abrir no Excel (delimitado por tabulações, uma vez que os objetos delimitados por vírgulas poderão ter problemas se o título contiver vírgulas.

Teste: link

    
por 13.09.2018 / 01:00
3

Esse é o formato JSON e você deve poder usar uma biblioteca JSON para extrair os dados. Eu estou usando este para o meu trabalho:

link

Observe que, nessa biblioteca, matrizes JSON (conteúdo entre [e]) são analisadas como VBA Collection , enquanto objetos JSON (entre {e}) são analisados como VBA Variant .

    
por 13.09.2018 / 01:52
1

Uma ferramenta gratuita e simples está disponível para converter arquivos de dados GPS para o Excel - GPSBabel.

link

É um projeto gratuito, então doe fundos para essa ferramenta muito útil.

    
por 12.09.2018 / 23:35