Bash: Por que ler retorna um status de saída diferente de zero ao ler meu arquivo?

3

Estou tentando ler dois arquivos linha por linha no Bash e fazer algo para cada uma das suas linhas. Aqui está o meu script Bash:

#!/usr/bin/env bash

die()
{
    echo "$@" >&2
    exit 1
}

extract_char()
{
    echo "$1" | sed "s/.*'\([^']*\)'.*//g"
}

file1=$1 # old
file2=$2 # new
counter=0

win_count=0
lose_count=0

test ! -z "$file1" || die "Please enter 2 files."
test ! -z "$file2" || die "Please enter 2 files."

while read -r line1 && read -r line2 <&3
do
    let counter++
    index=$(expr index "$line1" "'")
    if [ $index -ne 0 ]; then
        char=$(extract_char "$line1")
        char2=$(extract_char "$line2")
        test "$char" = "$char2" || die "Chars in line1 and line2 were not the same."
    elif [ "${line1#char.}" != "$line1" ]; then
        test "${line2#char.}" != "$line2" || die "Method signature found in line1, but not line2."
        method=${line1%:}
        method=${method#char.}
    elif ! grep -q '[^[:space:]]'; then
        # benchmark times
        if [ $(date --date="$line1" +%s%N) -gt $(date --date="$line2" +%s%N) ]; then
            echo "$char $method $counter: $line1 is greater than $line2"
            let lose_count++
        else
            let win_count++
        fi
    fi
done < "$file1" 3< "$file2"

echo
echo "Lines where this made an improvement: $win_count"
echo "Lines where this made a regression: $lose_count"

Seu uso é assim:

./compare.sh oldresults.txt newresults.txt

Em que oldresults.txt e newresults.txt são dois arquivos que contêm resultados de referência. Aqui está um arquivo de exemplo:

Test results for '\u0020':

char.IsUpper:
00:00:00.1231231
00:00:00:4564564

char.IsLower:
00:00:00:3453455
00:11:22:4444444

Tests for '\u1234':

# and so on

Por algum motivo, parece que read está retornando um status de saída diferente de zero antes de terminar de ler o arquivo. Aqui está a saída quando eu depurar meu script (via bash --debug -x compare.sh [args] ):

+ file1=oldresults.txt
+ file2=newresults.txt
+ counter=0
+ win_count=0
+ lose_count=0
+ test '!' -z oldresults.txt
+ test '!' -z newresults.txt
+ read -r line1
+ read -r line2
+ let counter++
++ expr index 'Test results for '\''\u0020'\'':
' \'
+ index=18
+ '[' 18 -ne 0 ']'
++ extract_char 'Test results for '\''\u0020'\'':
'
++ echo 'Test results for '\''\u0020'\'':
'
++ sed 's/.*'\''\([^'\'']*\)'\''.*//g'
+ char='\u0020'
++ extract_char 'Test results for '\''\u0020'\'':
'
++ echo 'Test results for '\''\u0020'\'':
'
++ sed 's/.*'\''\([^'\'']*\)'\''.*//g'
+ char2='\u0020'
+ test '\u0020' = '\u0020'
+ read -r line1
+ read -r line2
+ let counter++
++ expr index $'\r' \'
+ index=0
+ '[' 0 -ne 0 ']'
+ '[' $'\r' '!=' $'\r' ']'
+ grep -q '[^[:space:]]'
+ read -r line1 # exits the loop here
+ echo

+ echo 'Lines where this made an improvement: 0'
Lines where this made an improvement: 0
+ echo 'Lines where this made a regression: 0'
Lines where this made a regression: 0

Como você pode ver, o script itera em duas linhas: primeiro, a linha "Resultados do teste para ...", na qual extrai \u0020 entre as aspas e, em seguida, um retorno de carro. Depois disso, read -r line1 misteriosamente parece falhar e sai do loop.

Por que isso acontece e o que posso fazer para corrigir isso? Obrigado.

    
por James Ko 15.05.2016 / 04:19

1 resposta

3

O que está acontecendo é que grep -q '[^[:space:]]' está processando as linhas restantes na entrada padrão (que é o que grep faz por padrão se você não tiver dado nenhuma entrada), não deixando nada para o próximo read - o ponteiro do arquivo está em EOF. O que você vai querer é grep -q '[^[:space:]]' <<< "$line1" .

Uma maneira simples de evitar esse tipo de erro é sempre usar um descritor de arquivo não-padrão, se o seu código de loop não for trivial. Há muitas maneiras de engolir todos os stdin em um único comando, mas ainda não encontrei nenhum programa que tentará ler o FD 3 e superior por padrão.

    
por 15.05.2016 / 11:56