classificando uma lista mantendo uma entrada de cada linha duplicada

Question

classificando uma lista mantendo uma entrada de cada linha duplicada

#1 resposta do Jos (6 votos)
#2 resposta do Sergiy Kolodyazhnyy (4 votos)

4

Eu tenho uma lista de filmes que eu carrego diariamente e vem no seguinte formato

act-of-valor-2012
act-of-valor-2012
the-possession-2012
the-possession-2012
american-crude-2008
american-crude-2008
when-strangers-appear-2001
like-father-like-son-2005
like-father-like-son-2005
get-him-to-the-greek-2010
get-him-to-the-greek-2010
wall-street-money-never-sleeps-2010
wall-street-money-never-sleeps-2010
christmas-evil-1980
days-of-glory-1944

Eu preciso manter isso na mesma ordem, mas excluo as linhas duplicas para que se torne

act-of-valor-2012
the-possession-2012
american-crude-2008
when-strangers-appear-2001
like-father-like-son-2005
get-him-to-the-greek-2010
wall-street-money-never-sleeps-2010
christmas-evil-1980
days-of-glory-1944

classificar altera a ordem que alguém tem alguma idéia de como eu posso fazer isso?

Obrigações

command-line

por user2936691 14.07.2016 / 20:38

2 respostas

Tags command-line

lib32bz2-1.0 faltando em 16.04 [duplicado] Como instalo o photofilmstrip no Ubuntu 16.04?

score 6 · Answer 1

Você quer o comando uniq .

De man uniq :

 Filter adjacent matching lines from INPUT (or standard input), writing to OUTPUT (or standard output).

       With no options, matching lines are merged to the first occurrence.

Use da seguinte forma:

uniq movies.txt

Envie como desejado.

score 4 · Answer 2

Versão do AWK:

awk '{array[i++]=$0}END{for(j=0;j<=i;j++) if(array[j] != array[j-1]){print array[j]}  }' movies.txt

Basicamente, o que ele faz é ler os dados no array e imprimir apenas as linhas que não têm linha anterior como duplicadas.

O caminho mais curto seria como mostrado aqui :

$ awk '!a[$0]++' movies.txt                                                     
act-of-valor-2012
the-possession-2012
american-crude-2008
when-strangers-appear-2001
like-father-like-son-2005
get-him-to-the-greek-2010
wall-street-money-never-sleeps-2010
christmas-evil-1980
days-of-glory-1944