Linhas exclusivas baseadas no primeiro campo

1

Como você pode encontrar linhas exclusivas ou linhas duplicadas em um arquivo com base no conteúdo do primeiro campo ou nos primeiros n caracteres?

O comando uniq no OS X não possui a opção -w disponível no Linux: -w, --check-chars=N : compare no more than N characters in lines , que resolve o problema.

Pode ser feito sem reimplementar uniq no awk?

O número de campos não é constante. Eu gostaria de usar apenas ferramentas padrão instaladas no OS X. Eu uso muito o Macports, mas, neste caso, não quero usá-las.

    
por alecail 01.10.2012 / 09:15

1 resposta

5

Que tal usar sort -u ? Isso pode pelo menos classificar pelo primeiro campo:

 sort -k 1,1 -u input_file
    
por 01.10.2012 / 09:55

Tags