Desenhando um histograma de uma saída de comando bash

25

Eu tenho a seguinte saída:

2015/1/7    8
2015/1/8    49
2015/1/9    40
2015/1/10   337
2015/1/11   11
2015/1/12   3
2015/1/13   9
2015/1/14   102
2015/1/15   62
2015/1/16   10
2015/1/17   30
2015/1/18   30
2015/1/19   1
2015/1/20   3
2015/1/21   23
2015/1/22   12
2015/1/24   6
2015/1/25   3
2015/1/27   2
2015/1/28   16
2015/1/29   1
2015/2/1    12
2015/2/2    2
2015/2/3    1
2015/2/4    10
2015/2/5    13
2015/2/6    2
2015/2/9    2
2015/2/10   25
2015/2/11   1
2015/2/12   6
2015/2/13   12
2015/2/14   2
2015/2/16   8
2015/2/17   8
2015/2/20   1
2015/2/23   1
2015/2/27   1
2015/3/2    3
2015/3/3    2

E eu gostaria de desenhar um histograma

2015/1/7  ===
2015/1/8  ===========
2015/1/9  ==========
2015/1/10 ====================================================================
2015/1/11 ===
2015/1/11 =
...

Você sabe se existe um comando bash que me permita fazer isso?

    
por Natim 06.01.2015 / 17:45

7 respostas

10

Tente isso em :

perl -lane 'print $F[0], "\t", "=" x ($F[1] / 5)' file

EXPLICAÇÕES:

  • -a é uma matriz split() in @F explícita, obtemos os valores com $F[n]
  • x é dizer ao perl para imprimir um caractere N vezes
  • ($F[1] / 5) : aqui nós obtemos o número e o dividimos por 5 para uma saída de impressão bonita
por 06.01.2015 / 17:54
10

Em perl :

perl -pe 's/ (\d+)$/"="x$1/e' file
  • e faz com que a expressão seja avaliada, portanto, recebo = repetido usando o valor de $1 (o número correspondido por (\d+) ).
  • Você pode fazer "="x($1\/3) em vez de "="x$1 para obter linhas mais curtas. (O / tem escape, pois estamos no meio de um comando de substituição).

Em bash (inspirado em esta resposta SO ):

while read d n 
do 
    printf "%s\t%${n}s\n" "$d" = | tr ' ' '=' 
done < test.txt
  • printf preenche a segunda string usando espaços para obter uma largura de $n ( %${n}s ) e eu substituo os espaços por = .
  • As colunas são delimitadas usando uma guia ( \t ), mas você pode torná-lo mais bonito canalizando para column -ts'\t' .
  • Você pode usar $((n/3)) em vez de ${n} para obter linhas mais curtas.

Outra versão:

unset IFS; printf "%s\t%*s\n" $(sed 's/$/ =/' test.txt) | tr ' ' =

A única desvantagem que posso ver é que você precisará canalizar a saída de sed para algo se quiser reduzir a escala, caso contrário, essa é a opção mais limpa. Se houver uma chance de seu arquivo de entrada conter um dos [?* , você deve liderar o comando w / set -f; .

    
por 06.01.2015 / 17:58
6

Fácil com awk

awk '{$2=sprintf("%-*s", $2, ""); gsub(" ", "=", $2); printf("%-10s%s\n", $1, $2)}' file

2015/1/7 ========
2015/1/8 =================================================
2015/1/9 ========================================
..
..

Ou com a minha linguagem de programação favorita

python3 -c 'import sys
for line in sys.stdin:
  data, width = line.split()
  print("{:<10}{:=<{width}}".format(data, "", width=width))' <file
    
por 06.01.2015 / 23:00
3

Que tal:

#! /bin/bash
histo="======================================================================+"

read datewd value

while [ -n "$datewd" ] ; do
   # Use a default width of 70 for the histogram
   echo -n "$datewd      "
   echo ${histo:0:$value}

   read datewd value
done

Que produz:

~/bash $./histogram.sh < histdata.txt
2015/1/7    ========
2015/1/8    =================================================
2015/1/9    ========================================
2015/1/10   ======================================================================+
2015/1/11   ===========
2015/1/12   ===
2015/1/13   =========
2015/1/14   ======================================================================+
2015/1/15   ==============================================================
2015/1/16   ==========
2015/1/17   ==============================
2015/1/18   ==============================
2015/1/19   =
2015/1/20   ===
2015/1/21   =======================
2015/1/22   ============
2015/1/24   ======
2015/1/25   ===
2015/1/27   ==
2015/1/28   ================
2015/1/29   =
2015/2/1    ============
2015/2/2    ==
2015/2/3    =
2015/2/4    ==========
2015/2/5    =============
2015/2/6    ==
2015/2/9    ==
2015/2/10   =========================
2015/2/11   =
2015/2/12   ======
2015/2/13   ============
2015/2/14   ==
2015/2/16   ========
2015/2/17   ========
2015/2/20   =
2015/2/23   =
2015/2/27   =
2015/3/2    ===
2015/3/3    ==
~/bash $
    
por 08.01.2015 / 15:47
1

Isso me pareceu um divertido problema tradicional de linha de comando. Aqui está minha solução de script bash :

awk '{if (count[$1]){count[$1] += $2} else {count[$1] = $2}} \
        END{for (year in count) {print year, count[year];}}' data |
sed -e 's/\// /g' | sort -k1,1n -k2,2n -k3,3n |
awk '{printf("%d/%d/%d\t", $1,$2,$3); for (i=0;i<$4;++i) {printf("=")}; printf("\n");}'

O pequeno script acima assume que os dados estão em um arquivo com um nome imaginativo "data".

Eu não estou muito feliz com a linha "execute através do sed e do tipo" - seria desnecessário se o seu mês e dia do mês sempre tivessem 2 dígitos, mas isso é a vida.

Além disso, como uma nota histórica, os Unixes tradicionais costumavam vir com um utilitário de plotagem de linhas de comando que fazia gráficos e gráficos ASCII bastante feios. Não me lembro o nome, mas parece que o plotagens do GNU substitui o antigo utilitário tradicional.

    
por 06.01.2015 / 19:50
1

Bom exercício aqui. Eu despejei os dados em um arquivo chamado "dados" porque sou muito imaginativo.

Bem, você pediu em bash ... aqui está em pura festa.

cat data | while read date i; do printf "%-10s " $date; for x in $(seq 1 $i); do echo -n "="; done; echo; done

o awk é uma opção melhor.

awk '{ s=" ";while ($2-->0) s=s"=";printf "%-10s %s\n",$1,s }' data
    
por 07.01.2015 / 02:05
0

Tente isto:

while read value count; do
    printf '%s:\t%s\n' "${value}" "$(printf "%${count}s" | tr ' ' '=')"
done <path/to/my-output

A única parte complicada é a construção da barra. Eu faço isso aqui delegando para printf e tr como esta resposta SO .

Como bônus, é POSIX- sh -compliant.

Referências:

por 06.06.2018 / 18:29

Tags