Listando Palavras Duplicadas

Question

Listando Palavras Duplicadas

#1 resposta do glenn jackman (3 votos)

1

Eu tenho um arquivo que se parece com:

(aa,((bb,cc),dd));
(((aa,cc),ee),(ff,gg));
((aa,ff),hh);

Cada linha representa uma árvore filogenética no formato newick . Gostaria de listar todos os nomes que têm duplicados, ou seja, ocorrência > 1. Por exemplo, neste caso, a saída é:

aa, cc, ff

por havij 18.02.2016 / 01:54

1 resposta

Será minha perda de dados ao converter disco dinâmico em disco básico usando o assistente de partição minitool? Tentei mover um arquivo e agora não consigo encontrá-lo [duplicado]

score 3 · Accepted Answer

tr -cs '[:alpha:]' '\n' < file | sort | uniq -d | paste -sd,

Esse comando tr converte todas as sequências de não letras em uma nova linha