Perguntas sobre 'uniq'

O comando uniq exclui linhas repetidas em um arquivo. O comando uniq lê a entrada padrão ou um arquivo especificado pelo parâmetro InFile
1
resposta

Por que o uniq pode ignorar os caracteres iniciais, mas não os caracteres finais? [fechadas]

A ferramenta de linha de comando especificada por POSIX uniq foi projetada para "relatar ou filtrar fora linhas repetidas em um arquivo ". Além dos casos de uso que envolvem as linhas completas para comparação, há duas opções para comparaçã...
08.02.2017 / 04:27
4
respostas

Como encontrar linhas duplicadas em um arquivo de texto, enquanto algumas podem ser comentadas ou ter diferentes tokens no começo?

Eu tenho um arquivo de texto com linhas que são uma mistura como esta: ### Comments # Comments 86.242.200.81 banana.domain.net # comment 86.242.200.3 orange.domain.net 31.28.225.81 monkey.anotherdomain.net 51.18.33.4 puffin.domain...
08.08.2015 / 03:45
1
resposta

Uniq não removerá duplicados

Eu estava usando o seguinte comando curl -silent http://api.openstreetmap.org/api/0.6/relation/2919627 http://api.openstreetmap.org/api/0.6/relation/2919628 | grep node | awk '{print $3}' | uniq quando me perguntei por que uniq não rem...
08.02.2014 / 03:41
1
resposta

Por que o uniq está ignorando Unicode e linhas com uma única letra?

Estou tentando combinar os dicionários americano e britânico em um grande dicionário, e estou tentando remover todas as duplicatas do superconjunto, mas parece que o uniq não está emitindo palavras como "épée" ou single letras. Isso é o que e...
04.02.2013 / 21:26
3
respostas

Remove linhas quase duplicadas

Eu tenho um problema complicado que não consigo resolver. Eu tenho um arquivo de texto contendo alguns milhões de linhas de texto. Basicamente, quero executar uniq , mas com uma diferença: se duas linhas forem idênticas, mas para um sufixo...
06.05.2016 / 14:31
1
resposta

sort e uniq no awk

Eu sei que existem "sort" e "uniq" por aí, no entanto, a pergunta de hoje é sobre como utilizar o AWK para fazer esse tipo de trabalho. Diga se eu tenho uma lista de qualquer coisa realmente (ips, nomes ou números) e quero classificá-los; Aqu...
30.03.2015 / 10:10
3
respostas

Otimização de script para encontrar o nome do arquivo duplicado em um arquivo CSV grande

Eu tenho vários arquivos CSV de 1MB a 6GB gerados pelo script inotify com uma lista de eventos formatados como: timestamp;fullpath;event;size . Esses arquivos são formatados assim: timestamp;fullpath;event;size 1521540649.02;/home/wor...
11.04.2018 / 17:28
1
resposta

cut campos de comando

Eu notei esses dois comportamentos de campos diferentes usando o comando cut : bash:~$ var='cat /proc/cpuinfo | grep 'model name' | uniq | cut -d ' ' -f 3,4,5,6,7,8 ' echo $var saídas Intel(R) Core(TM) i7-3632QM CPU @ 2.20GHz...
01.11.2018 / 10:05
1
resposta

O método mais simples para contar linhas que correspondem a padrões específicos, incluindo '0' se a linha não for encontrada?

Eu tenho logs muito grandes (vários gigabytes por dia), que podem (mas não precisam) conter linhas específicas. Preciso contar o número de ocorrências de cada uma dessas linhas diariamente. Eu tenho um arquivo patterns.in , que contém as...
10.10.2012 / 18:45
2
respostas

Remover linhas duplicadas com uma torção [duplicada]

Ok, então eu quero remover linhas duplicadas, mas é um pouco mais complicado do que isso ... Eu tenho um arquivo chamado users.txt, o exemplo do arquivo é: users:[email protected] users1:[email protected] Agora, devido a um bug no meu...
02.03.2017 / 00:45