Por que esses valores não podem ser unificados?

2

Estou tentando descobrir quais endereços IP atingem o servidor com mais frequência. Recebi esta saída surpreendente de uniq :

$ cat access_log | awk '{print $1}' | uniq -c | sort -bnr | head
 26 73.23.5.25
 25 73.23.5.25
 24 73.23.5.25
 23 73.23.5.25
 23 73.23.5.25
 23 73.23.5.25
 22 73.23.5.25
 21 73.23.5.25
 19 73.23.5.25
 18 73.23.5.25

Por que esses endereços não podem ser considerados o mesmo endereço em uniq ? Eu olhei para o arquivo de origem e não há abas malucas ou outro espaço em branco. Estes são logs de acesso do Apache bastante comuns.

    
por dotancohen 12.08.2014 / 16:13

1 resposta

4

EDIT: você precisa classificar ANTES de executar o uniq, caso contrário não funcionará:

cat access_log | awk '{print $1}' | sort | uniq -c | sort -bnr | head
    
por 12.08.2014 / 16:15