Como remover entradas duplicadas de um arquivo?

Question

Como remover entradas duplicadas de um arquivo?

#1 resposta do (3 votos)
#2 resposta do (1 votos)

1

Eu tenho uma lista separada por vírgulas de nomes de domínio em um arquivo; infelizmente existem entradas duplicadas para alguns nomes de domínio.

Existe uma maneira de encontrar e remover as entradas duplicadas do arquivo?

A saída da amostra é como abaixo: -

culturaurbanashop.com,remaxcorn.info,enjoygoing.com,full-kit-wankers.co.uk,paracaballo.com,radiopozarica.com,sprinklermaps.com,unlock-any-phone.com,voipbillingplus.com,yedincicadde.net,klasseaparte.com,allfortheweb.com,indulgesolutions.com,fastextcafe.info,titi.sickworldhosting.com,kebeico.com,facemowi.it,mellat.info,sal-gov.info,hindustan4848.com,nawaopls.co.za,familie-ries.de

sort

por Ankit 09.04.2013 / 20:08

2 respostas

1

Se você quer dizer que as duplicatas devem ser removidas das listas de palavras separadas por vírgulas (onde as palavras são sequências de não-espaços em branco), então talvez algo como:

$ echo 2,1,1,2,c,1 a,a,a,b,c | perl -M'List::MoreUtils uniq' -lpe '
    s/[\S,]+,[\S,]+/join ",", uniq(split",",$&)/ge'
2,1,c a,b,c

por 09.04.2013 / 20:43

Tags sort

Script de segundo plano executado no login interrompido quando eu executo o tmux no terminal Os arquivos .bz2 dentro de / var / lib / pengine são seguros para excluir?

score 3 · Accepted Answer

Tente:

tr ',' '\n' < infile | sort -u | paste -sd, -