Um simples awk
one-liner resolve seu exemplo:
awk '/^Entry/{k=$0;next}{g[k]=g[k]"\n"$0}END{for(k in g)print k g[k]}' file1 file2
Suponho que você saiba que basicamente awk
processa as linhas de entrada uma após a outra, de acordo com um programa. Este programa awk
específico é especificado como primeiro argumento e consiste em três instruções. Vamos analisá-los um por um:
-
/^Entry/{k=$0;next}
significa: se a linha processada corresponder a/^Entry/
, armazene-a na variávelk
e vá para o próximo ciclo, ignorando as seguintes declarações. -
{g[k]=g[k]"\n"$0}
não tem nenhuma condição anterior, portanto é sempre executado e significa: atualiza o valor armazenado no dicionáriog
com a chavek
: o novo valor deve ser o concatenação do valor anterior (possivelmente vazio)g[k]
, um retorno de carro"\n"
e a linha atual. -
END{for(k in g)print k g[k]}
tem uma condiçãoEND
e, portanto, é executado quando todas as linhas de entrada tiverem sido processadas. Ele diz: para cada chave emg
, ou seja, para cada título que apareceu nos arquivos de entrada, imprima o valor associado, que é a concatenação de todas as linhas encontradas nos arquivos de entrada sob esse título.
Para usar o IRL, você precisa substituir /^Entry/
pelo padrão correto (provavelmente /^\$\$\$/
).