Gostaria de verificar se duas linhas começam com o mesmo número na primeira coluna, se isso acontecer, então a média da segunda coluna deve ser exibida. Exemplo de arquivo:
01 21 6 10% 93.3333%
01 22 50 83.3333% 93.3333%
02 20.5 23 18.1102% 96.8504%
02 21.5 100 78.7402% 96.8504%
03 22.2 0 0% 100%
03 21.2 29 100% 100%
04 22.5 1 5.55556% 100%
04 23.5 17 94.4444% 100%
05 22.7 9 7.82609% 100%
05 21.7 106 92.1739% 100%
06 23 11 17.4603% 96.8254%
06 22 50 79.3651% 96.8254%
07 20.5 14 18.6667% 96%
07 21.5 58 77.3333% 96%
08 21.8 4 100% 100%
09 22.6 0 0% 100%
09 21.6 22 100% 100%
Por exemplo, as duas primeiras linhas começam com 01
, mas há apenas uma linha começando com 08
(15ª linha). Portanto, a saída com base nesses dois casos deve ser:
01 21.5
...
...
...
08 21.8
...
...
...
Acabei com a seguinte linha awk, que funciona muito bem quando o arquivo sempre tem duas linhas semelhantes, mas falha usando o arquivo mostrado acima (porque a 15ª linha):
awk '{sum+=$2} (NR%2)==0{print sum/2; sum=0;}'
Qualquer dica é bem-vinda,