Estou procurando um comando para contar o número de todas as palavras em um arquivo. Por exemplo, se um arquivo é assim,
today is a
good day
então deve imprimir 5 , pois há 5 palavras.
Por que o utilitário wc é tão lento?
Quando eu o executo em um arquivo grande, ele demora cerca de 20 vezes mais do que o md5sum:
MyDesktop:/tmp$ dd if=/dev/zero bs=1024k count=1024 of=/tmp/bigfile
1024+0 records in
1024+0 records out
1073...
Eu tenho um arquivo CSV como este:
abd,123,egypt,78
cde,456,england,45
Como posso obter a contagem de caracteres apenas das palavras da terceira coluna?
Não consigo descobrir como obter wc para fazer isso.
Ao executar
echo abcd | wc -c
retorna 5 .
Mas a palavra abcd tem apenas 4 caracteres.
A echo está imprimindo algum caractere especial após a palavra abcd ?
E eu posso impedir que echo imprima isso?
Como programador C, fiquei surpreso ao ver que wc -c (que conta o número de bytes) e wc -m (que conta o número de caracteres) geram resultados muito diferentes para um longo arquivo de texto meu . Sempre me disseram que sizeof(char) é 1...
Eu tenho um arquivo com linhas em branco no final do arquivo.
Posso usar grep para contar o número de linhas em branco no final do arquivo com o nome do arquivo sendo passado como variável no script?
Eu adicionei um alias do git para fornecer as contagens de linha de arquivos específicos no meu histórico:
[alias]
lines = !lc() { git ls-files -z ${1} | xargs -0 wc -l; }; lc
No entanto, wc -l está relatando vários totais, de modo que...
Eu tenho um arquivo de texto grande (~ 50Gb quando gz'ed). O arquivo contém 4*N lines ou N records; isso é todo registro consiste em 4 linhas. Eu gostaria de dividir este arquivo em 4 arquivos menores, cada um com aproximadamente 25% do ar...