Mesclando quatro arquivos json delimitados por nova linha usando jq

1

Estou tentando mesclar 4 arquivos JSON (no futuro talvez mais dois). O único fator comum entre os arquivos JSON delimitados por nova linha é "vulnid".

File 1: 
{"vulnid":"cve1", "product":"product1"}
{"vulnid":"cve2", "product":"product2"}
{"vulnid":"cve3", "product":"product3"}
{"vulnid":"cve4", "product":""}
{"vulnid":"cve5", "product":""}
{"vulnid":"cve6", "product":""}

File 2: 
{"vulnid":"cve1", "version":"version1"}
{"vulnid":"cve2", "version":"version2"}
{"vulnid":"cve3", "version":"version3"}
{"vulnid":"cve4", "version":"version4"}

File 3: 
{"vulnid":"cve1", "patch":"patch1"}
{"vulnid":"cve2", "patch":"patch2"}
{"vulnid":"cve3", "patch":"patch3"}
{"vulnid":"cve4", "patch":""}

File 4: 
{"vulnid":"cve1", "speed":"speed1"}
{"vulnid":"cve2", "power":"power2"}
{"vulnid":"cve3", "amps":"amps3"}
{"vulnid":"cve4", "product":"product4"}
{"vulnid":"cve4", "patch":"patch4"}


Required output:
{"vulnid":"cve1", "product":"product1", "version":"version1", "patch":"patch1", "speed":"speed1"}
{"vulnid":"cve2", "product":"product2", "version":"version2", "patch":"patch2", "power":"power2"}
{"vulnid":"cve3", "product":"product3", "version":"version3", "patch":"patch3", "amps":"amps3"}
{"vulnid":"cve4", "product":"product4", "version":"version4", "patch":"patch4"}
{"vulnid":"cve5", "product":""}
{"vulnid":"cve6", "product":""}

O que tentei até agora:

jq -s '.[0] * .[1] * .[3] * .[4]' json1 json2 json3 json4
jq -s '.[0] + .[1] + .[3] + .[4]' json1 json2 json3 json4

... e várias combinações diferentes de jq, todas elas forneceram resultados incorretos e provaram o ponto de não entender a ferramenta.

É mesmo possível realizar essa fusão usando o campo "vulnid" com jq?

    
por Anna 04.07.2018 / 19:56

2 respostas

2

A solução mais curta jq :

jq -sc 'group_by(.vulnid)[] | add' file*.json

A saída:

{"vulnid":"cve1","product":"product1","version":"version1","patch":"patch1","speed":"speed1"}
{"vulnid":"cve2","product":"product2","version":"version2","patch":"patch2","power":"power2"}
{"vulnid":"cve3","product":"product3","version":"version3","patch":"patch3","amps":"amps3"}
{"vulnid":"cve4","product":"product4","version":"version4","patch":"patch4"}
{"vulnid":"cve5","product":""}
{"vulnid":"cve6","product":""}
    
por 05.07.2018 / 08:05
1

Sim, eu acho que sim.

Se alterarmos os dados para que tenhamos as vulnid strings como chaves, com o próprio objeto como o valor correspondente (por exemplo, {"cve1": {"vulnid": "cve1", "product": "product1" }} ), podemos usar reduce e * para combinar os dados com as mesmas chaves. O primeiro map() abaixo produz o formato correto para o reduce .

Assim, com sua entrada de amostra no arquivo json :

$ < json jq -s 'map({(.vulnid): . }) | reduce .[] as $item ({}; . * $item) '
{
  "cve1": {
    "vulnid": "cve1",
    "product": "product1",
    "version": "version1",
    "patch": "patch1",
    "speed": "speed1"
  },
  ...

Então é bastante simples soltar o fluff ao redor dos objetos para obter a saída esperada:

$ < json jq -s 'map({(.vulnid): . }) | 
                    reduce .[] as $item ({}; . * $item) | map(.) | .[]'
{
  "vulnid": "cve1",
  "product": "product1",
  "version": "version1",
  "patch": "patch1",
  "speed": "speed1"
}
...

Eu não ficaria surpreso se houvesse uma maneira melhor de fazer tudo isso.

    
por 04.07.2018 / 21:08

Tags