Eu tenho uma grande quantidade de arquivos json e anteriormente me disseram para usar a seguinte linha para pesquisar se um tweet é criado em um intervalo de tempo específico em uma data:
grep -wirnEzc '},.*created_at":\s"Wed Oct 19 2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00)) .* 2016' *
Não sei quais são os seguintes exatamente tentando representar:
2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00))
Por enquanto, preciso alterá-lo para que eu possa encontrar o número de resultados retornados por este grep entre 17 de julho de 2016 e 8 de novembro de 2016 para o campo "created_at". Aqui está um exemplo de um desses arquivos json: link
Como você vê, cada arquivo json pode conter vários tweets. Então, basicamente, estou procurando pesquisar todos esses arquivos * .json e pesquisar os padrões "created_at":
que são seguidos na próxima linha por "retweeted":
, porque outras coisas, como perfil ou imagem de perfil, podem ter o atributo "created_at":
. E o período que estou procurando é 17 de julho de 2016 a 8 de novembro de 2016.
Um exemplo de interesse (não data-sábio):
},
"created_at": "Wed Dec 14 22:34:28 +0000 2016",
"retweeted": false,
"coordinates": null,
"in_reply_to_user_id_str": null,
"source": "<a href=\"https://ifttt.com\" rel=\"nofollow\">IFTTT</a>",
"in_reply_to_status_id_str": null,
"in_reply_to_screen_name": null,
"in_reply_to_user_id": null,
"extended_entities": {