remove linhas duplicadas após a primeira palavra no terminal linux sentace

2

Eu estava procurando remover duplicatas de linhas de texto, mas depois de um espaço da primeira palavra nesse formato;

apples blue
apples green
apples are sometimes red
pairs green
pairs black
potato brown
lemon
...

Qualquer coisa depois de um espaço em cada linha seria desconsiderada e, em seguida, removida as duplicatas.

Acabaria com;

apples
pairs
potato
lemon

Espero que esteja procurando uma maneira de fazer isso no terminal do linux;

command file_in.txt single_sout.txt

Obrigado pessoal!

    
por mark 20.09.2014 / 00:42

1 resposta

2

Experimente este verso:

cut -d " " -f 1 file_in.txt | uniq > file_out.txt

Primeiro, use o comando cut com o delimitador -d " " e, em seguida, obtenha o primeiro campo com -f 1 do arquivo file_in.txt . Em seguida, canalize o resultado no comando uniq e isso removerá duplicatas da lista. Finalmente você redireciona o resultado para file_out.txt .

    
por 20.09.2014 / 00:49