Como apagar os números repetidos em uma coluna em um arquivo?

Question

Como apagar os números repetidos em uma coluna em um arquivo?

#1 resposta do (6 votos)
#2 resposta do (2 votos)

4

Eu tenho um arquivo parecido com:

entrada:

Então eu preciso que cada número apareça apenas uma vez:

Fora:

alguma sugestão considerando que o arquivo real é enorme com muitas repetições?

text linux

por zara 10.08.2016 / 14:23

2 respostas

2

Você precisa classificar se deseja remover duplicatas que ainda não estão em linhas consecutivas, como:

cat FILE1 | sort -nu > FILE2

sort -n significa classificação numérica e -u remove linhas duplicadas consecutivas (como o comando autônomo uniq faz em arquivos / dados classificados).

por 10.08.2016 / 14:34

Tags text linux

su vs su - (no Debian): por que o PATH é o mesmo? desabilita a chave de inserção para todos os aplicativos, exceto um

score 6 · Accepted Answer

Aqui você está:

$ uniq inputFile > outputFile

Mas observe uniq apenas remove as linhas repetitivas que vêm uma após a outra e sequencialmente. Então, se você quiser excluir todas as linhas repetitivas, mesmo aquelas que não vêm em seqüência, você pode primeiro sort do seu arquivo de entrada e o uso uniq :

$ sort -g inputFile | uniq > outputFile

A opção

-g será comparada de acordo com o valor numérico geral.

Ou use apenas sort -nu inputFile > outputFile