Faz loop sobre linhas de arquivo, arquivo de partição e classifica cada partição

1

A seguir, coloquei meu código para iterar linhas de um arquivo para coletar dados de um segmento do arquivo da seguinte forma:

Ilustração para entender o procedimento:

segL                     segH
|                         |
[  2 4 9 15 25 45 ... 99  ] 102 136 ... 206

Mais tarde, para um arquivo com 10000 linhas, gostaria de dividir o arquivo em segmentos de tamanho igual com um limite inferior de segL e segH=segL+segsize .
Andando pelo arquivo, gostaria de contar o número de inteiros que estão seguindo a seguinte condição:% segL < integer =< segH . Este número, então, deve ser armazenado em uma variável contendo unicamente a quantidade de inteiros apenas para esse mesmo segmento!

Código

segsize=100
segL=0
segH=100
blockcounter=0
segment1=0
segments2=0
#Go through input and partition it
for i in {1..2}
do
    while read p; do
        if [ $p -gt $segL ] && [ $p -le $segH ]
        then
            blockcounter=$(($blockcounter + 1))
        fi
    done <$inputfile

    if [ "$i" -eq "1" ]
    then
        segment1=$blockcounter
        echo "segment1: $segment1"
    fi
    if [ "$i" -eq "2" ]
    then
        segment2=$blockcounter
        echo "segment2: $segment2"
    fi
blockcounter=0
segL=$segH
segH=$(($segL + $segsize))
done

Neste momento, no meu código, posso coletar dados apenas para dois segmentos - com meu arquivo, atualmente, contendo um pouco mais de 200 inteiros (2 * segmentos).

Saída:

segment1: 27
segment2: 33

Para amostras maiores, preciso armazenar dados em até 100-120 segmentos com uma saída comparável mencionada acima.

Você pode pensar em alternativas para alcançar a mesma saída (objeto semelhante a matriz 2D para armazenar pontos de dados, por exemplo, A(segment1|<count of integers>) ?

    
por Aliakbar Ahmadi 23.07.2015 / 23:43

1 resposta

1

Não sei se entendi o problema corretamente ...

#!/bin/bash

segsize=100
segL=0
max=0
a=()

while read p; do
        (( n = (p - segL - 1) / segsize ))
        if (( n + 1 > max )); then
                for ((i = max; i < n + 1; i++)) do
                        a+=(0)
                done
                (( max = n + 1 ))
        fi
        (( a[n]++ ))
done

for ((i = 0; i < max; i++)); do
        echo "segment $((i+1)) ($((segsize*i)), $((segsize*(i+1)))] : ${a[$i]}"
done

Entrada (cada número deve ser > 0):

1
100
101
200
1000
1001 

Saída:

segment 1 (0, 100] : 2
segment 2 (100, 200] : 2
segment 3 (200, 300] : 0
segment 4 (300, 400] : 0
segment 5 (400, 500] : 0
segment 6 (500, 600] : 0
segment 7 (600, 700] : 0
segment 8 (700, 800] : 0
segment 9 (800, 900] : 0
segment 10 (900, 1000] : 1
segment 11 (1000, 1100] : 1
    
por 24.07.2015 / 02:57