Exibe apenas linhas duplicadas, ignorando os primeiros x espaços por linha

Question

Exibe apenas linhas duplicadas, ignorando os primeiros x espaços por linha

#1 resposta do (4 votos)

4

Eu tenho um arquivo com linhas numeradas. Os números ocupam os primeiros 7 espaços de cada linha. Eu quero verificar o restante da linha para duplicatas e apenas as duplicatas de saída.

Por exemplo, meu arquivo pode ser:

Nesse caso, eu gostaria que minha saída fosse:

     1 abcde
     5 abcde

A formatação de saída não importa muito, é claro, mas seria ótimo se as sequências de caracteres duplicadas fossem combinadas para que eu as encontrasse mais facilmente.

Estou usando o Linux.

text-processing

por user146854 16.12.2015 / 11:40

1 resposta

Tags text-processing

Como evitar chamar 'startx' no login do ssh O udev pode disparar uma ação no mount sozinho?

score 4 · Accepted Answer

sort do arquivo no segundo campo, e diga ao GNU uniq para pular os primeiros 7 caracteres ( -s 7 ), dizendo para imprimir linhas repetidas ( -D ):

$ sort -k2,2 foo | uniq -Ds 7
     1 abcde
     5 abcde