Contagem de palavras duplicadas em um arquivo de texto

Question

#1 resposta do rɑːdʒɑ (1 votos)

1

Eu tenho um arquivo de 20 mb com texto e ids. Eu preciso de um grep ou algo para contar e mostrar quaisquer ids duplicados.

por Martin 07.06.2012 / 07:22

1 resposta

99% de uso da CPU sem motivo Ubuntu Server 12.04, problemas de Wifi

score 1 · Accepted Answer

awk '{print }' file_name | sort | uniq -c | sort -n | awk '>1 {print }' > duplicates
for x in $(< duplicates); do grep -n $x file;
done

Então, se você tem os ID's na segunda coluna, então ele imprimirá os IDs dos Duplicados

Nota: No nome do arquivo, coloque o nome do arquivo.