Eu estou tentando fazer um conjunto único de linhas extraídas de um arquivo com egrep com sort -u, e depois contá-las. Cerca de 10% das linhas (todos os 100 caracteres do alfabeto [ATCG]) são duplicados. Existem dois arquivos, cerca de 3 GB cada...
09.07.2015 / 22:03