Classificando / contando um arquivo delimitado por tabulação

0

Eu tenho um arquivo delimitado por tabulações com várias colunas. Gostaria de extra o número de vezes que vejo algo na coluna A e imprimo os dados associados ao valor na coluna A em uma nova coluna B.

Ex:

1 blue                                        
1 green
1 red            
100 blue           
100 red

Eu gostaria de um arquivo de saída que leia

3 1 blue,green,red
2 100 blue,red

Há algum tempo para fazer isso usando awk ou perl?

    
por mlr 30.01.2017 / 18:06

2 respostas

1

no awk:

{
  if (count[$1] == "") {
    count[$1] = 1;
    results[$1] = $2;
  } else {
    count[$1] = count[$1] + 1;
    results[$1] = results[$1] "," $2;
  }
}
END {
  for (number in count) {
    print count[number],number,results[number];
  }
}

resulta na saída de: 2 100 blue,red 3 1 blue,green,red

para seus dados de amostra acima.

A ordem dos resultados pode não ser exatamente o que você deseja, não sei ao certo como isso é importante para você.

    
por 30.01.2017 / 18:32
0

Aqui está o que eu tentei que pode funcionar para você. NOTA: "1" = tab char, mude para " " para espaço)

awk 'BEGIN { s = "1"; c = "," ; cnt = 0; all_colors = "" } {
    if ( NR == 1 ) { num = $1; colors[cnt++] = $2 }
    else {
        if ( num != $1 ) {
            for (x=0; x<cnt; x++) {
                all_colors = all_colors colors[x]
                }
            print cnt s num s all_colors; cnt = 0; all_colors = ""
            num = $1; colors[cnt++] = $2
            }
        else { colors[cnt++] = c $2 }
        }
    }
END {
    all_colors = ""
    for (x=0; x<cnt; x++) { all_colors = all_colors colors[x] }
    print cnt s num s all_colors
}' tab_file

   tab_file                output
1       blue          3       1       blue,green,red
1       green         2       100     blue,red
1       red
100     blue
100     red
    
por 04.05.2017 / 22:11