Como medir o tamanho dos dados canalizados?

14

Eu gostaria de fazer algo assim:

> grep pattern file.txt | size -h
16.4 MB

ou algo equivalente a:

> grep pattern file.txt > grepped.txt
> ls -h grepped.txt
16.4 MB
> rm grepped.txt

(isso seria um pouco inconveniente, no entanto)

Isso é possível?

    
por Raffael 26.02.2018 / 14:35

4 respostas

27

Você pode usar wc para isso:

grep pattern file.txt | wc -c

contará o número de bytes na saída. Você pode pós-processar o para converter valores grandes para o formato “legível por humanos” .

Você também pode usar pv para obter essas informações dentro de um canal:

grep pattern file.txt | pv -b > output.txt

(exibe o número de bytes processados, em formato legível).

    
por 26.02.2018 / 14:37
9

Você pode usar a ferramenta pipeviewer pv com o total de sinalizadores de contagem de bytes -b :

$ dd if=/dev/zero bs=3 count=4211 2>/dev/null | pv -b >/dev/null
12.3KiB

$ grep pattern file.txt | pv -b >/dev/null
    
por 26.02.2018 / 14:44
3

O utilitário Pipe Viewer foi projetado para essa finalidade. Se não for flexível o suficiente para seus propósitos, então você pode implementar seu próprio código de medição de transferência de dados FIFO com a biblioteca de manipulação de pipeline ( libpipeline ) chamadas como pipeline_pump() e pipeline_peek_size() .

$ whatis pv
pv (1)               - monitor the progress of data through a pipe
$ pv -Wi 0.002 -cf /etc/hosts | wc -l
 367 B 0:00:00 [2.71MiB/s] 
[============================================================================>] 
100%
10
$
    
por 26.02.2018 / 15:05
1

Pode-se preparar rapidamente sua própria solução em Python:

#!/usr/bin/env python
import sys

count = 0
while True:
    byte = sys.stdin.read(1)
    if not byte:
        break
    count =  count + 1

print(count)

Funciona da seguinte forma:

$ echo "Hi" | ./count_stdin_bytes.py
3
$ echo "Hello" | ./count_stdin_bytes.py
6
$ dd if=/dev/zero bs=1 count=1024 2>/dev/null |  ./count_stdin_bytes.py 
1024

Como no seu caso particular você está lidando com dados de texto (a julgar pelo fato de você canalizar de grep ), você também pode usar bash do read . Algo parecido com isto:

$ echo "Hello" | { while read -n 1 char; do ((count++)) ;done ; echo $count; }
6
    
por 27.02.2018 / 10:16

Tags