Perguntas sobre 'uniq'

O comando uniq exclui linhas repetidas em um arquivo. O comando uniq lê a entrada padrão ou um arquivo especificado pelo parâmetro InFile
1
resposta

Versão menos cara de 'sort -n | uniq -c | sort -n '

Eu tenho uma lista não classificada de IPs que preciso contar e classificar por ocorrências. Eu uso sort -n | uniq -c | sort -n e isso funciona bem, mas eu gostaria de algo menos caro ... certamente awk pode fazer isso? Entrada 1.1....
29.10.2017 / 22:28
2
respostas

sort e uniq individualmente em um arquivo de texto

Eu tenho um arquivo como abaixo: D F T E A R T E K A O E E T P J Gostaria de classificar cada coluna individualmente e as colunas individualmente, conforme abaixo: A A O E D F P J E R T K T Gostaria de saber se existe alguém que sa...
03.07.2015 / 08:48
4
respostas

Encontre duplicatas por coluna em um arquivo

Eu tenho um arquivo de entrada contendo caminhos de arquivo e seu md5sum, separados por ponto e vírgula e classificados por hashes md5: /media/LaCie/Images/recup2/recup_dir.1/f1295328.jpg;0080ececd3da8533f5d11e449cf73287 /media/LaCie/Document...
14.02.2016 / 16:29
1
resposta

Classificar dados de log com o bash

Eu tenho um arquivo de log contendo tais entradas 192.168.1.1;query=/etc/security/limits.conf;date=02.03.16 192.168.1.1;query=/etc/security/limits.conf;date=01.06.15 192.168.1.2;query=/etc/security/limits.conf;date=02.03.16 192.168.1.1;query=...
05.03.2016 / 03:27
3
respostas

awk combina dois arquivos grandes e remove linhas duplicadas [closed]

Eu tenho dois arquivos: A.txt - cerca de 90 GB | B.txt - cerca de 80 GB Eu quero combinar dois arquivos e remover linhas duplicadas. Como faço isso? Se outros comandos, além de awk , forem melhores para esse trabalho, avise-nos.  ...
10.03.2017 / 14:25
5
respostas

Como deixar 'classificar | uniq -c 'separa o número de ocorrências por um caracterizador de tabulação?

uniq -c separe o número da ocorrência por espaços, o que é difícil para cut ou awk separar depois. 1000_A1\tB1\n ___1_A2\tB2\n Eu posso resolver esse problema usando sed -r 's/^ *([0-9]+)/\t/' para alterar o delimitador para a...
10.10.2011 / 04:48
4
respostas

conta o número de ocorrências de substring e mantém a maior pontuação

Eu tenho uma lista de string como: StringA 45 StrinB 98 StringA 35 StringA 83 StrinB 78 StringC 65 StrinB 98 e eu quero filtrar as duplicatas, imprima o número de ocorrências (da subseqüência que pode ser de comprimento diferente,...
06.07.2018 / 06:13
2
respostas

Linhas comuns entre dois arquivos [duplicados]

Eu tenho o seguinte código que eu executo no meu terminal. LC_ALL=C && grep -F -f genename2.txt hg38.hgnc.bed > hg38.hgnc.goi.bed Isso não me dá as linhas comuns entre os dois arquivos. O que estou perdendo ai?     
14.10.2017 / 20:46
2
respostas

Removendo linhas com um único campo comum

Eu tenho um arquivo separado por tabulações que se parece com isso: 123 some text 123 some different text 334 some other text 341 more text e eu quero fazer duas coisas. Uma delas é pedir tudo numericamente (isso é fácil de fazer)...
04.07.2014 / 17:29
4
respostas

print caminho completo de diretórios pai de localizar saída

o que eu quero fazer é encontrar todos os arquivos com base em alguma consulta de pesquisa e obter o diretório pai dos pais ( ../.. ) caminho completo. Por exemplo, find . -name "__openerp__.py" e, em seguida, para cada arquivo, execute...
29.01.2014 / 13:30