Como encontrar o min de uma coluna em todos os intervalos nth de um arquivo, usando sed, sort, tail?

1

Eu quero encontrar o mínimo da quinta coluna de um arquivo em cada intervalo de 12 e salvar a linha associada em um novo arquivo.

Para encontrar o mínimo da última 12ª linha, posso usar

tail -n 12  $FILEname | sort -g -k 5,5 | head -1|  awk '{print}'> tmp.out

Mas como posso realizar esse processo de forma iterativa? Eu tentei

while read $FILEname
do
 ....
done

que não foi bem sucedido.

O arquivo parece

4.7 0.17    0.529   0   4.4846
4.7 0.17    0.529   1   4.5437474
4.7 0.17    0.529   2   5.63229739
4.7 0.17    0.529   3   4.672385157
4.7 0.17    0.529   4   4.698922468
4.7 0.17    0.529   5   4.699977195
4.7 0.17    0.529   6   4.699969329
4.7 0.17    0.529   7   3.69999717
4.7 0.17    0.529   8   4.6999998
4.7 0.17    0.529   9   2.7
4.7 0.17    0.59    10  3.9999998
4.7 0.17    0.59    11  4.69999999998
5   1   0.59    0   4.49569846
5   1   0.59    1   4.54330574
5   1   0.59    2   4.63739653
5   1   0.59    3   3.67233957
5   1   0.59    4   4.6989202468
5   1   0.59    5   4.699912595
5   1   0.59    6   4.6999329
5   1   0.59    7   4.69999999717
5   1   0.59    8   4.69999998
5   1   0.59    9   3.2547
5   1   0.529   10  4.69999999998
5   1   0.529   11  4.69999999998

com quase 2000 linhas.

    
por Shasa 25.11.2016 / 11:32

1 resposta

1

tente

awk 'NR%12 == 1 { min=$5 ; line=$0; } 
    { if ($5 < min) { min=$5 ;line=$0; } } 
    NR%12 == 0 { print line ;} 
    END { if (NR%12) print line ;} ' 

isto basicamente redefine min a cada 12 linhas (1,13,25, ...), compute min e imprima para a linha 12,24,36, ...

END instrução print last min se o número de linha não for um múltiplo de 12.

observe que você pode colocar uma linha nessa declaração, chamá-la com

awk '....' input_file.txt
    
por 25.11.2016 / 11:58