procurando por “created_at”: seguido na próxima linha por “retweeted”: em muitos arquivos json para um intervalo específico

3

Eu tenho uma grande quantidade de arquivos json e anteriormente me disseram para usar a seguinte linha para pesquisar se um tweet é criado em um intervalo de tempo específico em uma data:

grep -wirnEzc '},.*created_at":\s"Wed Oct 19 2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00)) .* 2016' *

Não sei quais são os seguintes exatamente tentando representar:

2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00))

Por enquanto, preciso alterá-lo para que eu possa encontrar o número de resultados retornados por este grep entre 17 de julho de 2016 e 8 de novembro de 2016 para o campo "created_at". Aqui está um exemplo de um desses arquivos json: link

Como você vê, cada arquivo json pode conter vários tweets. Então, basicamente, estou procurando pesquisar todos esses arquivos * .json e pesquisar os padrões "created_at": que são seguidos na próxima linha por "retweeted": , porque outras coisas, como perfil ou imagem de perfil, podem ter o atributo "created_at": . E o período que estou procurando é 17 de julho de 2016 a 8 de novembro de 2016.

Um exemplo de interesse (não data-sábio):

}, 
            "created_at": "Wed Dec 14 22:34:28 +0000 2016", 
            "retweeted": false, 
            "coordinates": null, 
            "in_reply_to_user_id_str": null, 
            "source": "<a href=\"https://ifttt.com\" rel=\"nofollow\">IFTTT</a>", 
            "in_reply_to_status_id_str": null, 
            "in_reply_to_screen_name": null, 
            "in_reply_to_user_id": null, 
            "extended_entities": {
    
por Mona Jalal 05.04.2018 / 02:54

0 respostas