EDIT: você precisa classificar ANTES de executar o uniq, caso contrário não funcionará:
cat access_log | awk '{print $1}' | sort | uniq -c | sort -bnr | head
Estou tentando descobrir quais endereços IP atingem o servidor com mais frequência. Recebi esta saída surpreendente de uniq
:
$ cat access_log | awk '{print $1}' | uniq -c | sort -bnr | head
26 73.23.5.25
25 73.23.5.25
24 73.23.5.25
23 73.23.5.25
23 73.23.5.25
23 73.23.5.25
22 73.23.5.25
21 73.23.5.25
19 73.23.5.25
18 73.23.5.25
Por que esses endereços não podem ser considerados o mesmo endereço em uniq
? Eu olhei para o arquivo de origem e não há abas malucas ou outro espaço em branco. Estes são logs de acesso do Apache bastante comuns.
Tags text-processing uniq