Como procurar um padrão entre as linhas 1500 a 2500?

2

Eu tenho 8 arquivos e cada um contém cerca de 2000 linhas. Eu quero pesquisar a palavra em particular nesses arquivos entre o número de linha 1500 a 2500.

A saída deve se parecer com:

sample_1.txt :

1510:declare var testing


sample_2.txt :

1610:declare var testing


sample_7.txt :

1610:declare var testing


sample_10.txt :

1710:declare var testing

É possível usar grep para essa tarefa?

    
por bharanikumar 25.01.2011 / 08:43

4 respostas

1

Tente isto:

#!/usr/bin/awk -f
BEGIN {
    begin = ARGV[1]
    end = ARGV[2]
    pattern=ARGV[3]
    ARGV[1] = ARGV[2] = ARGV[3] = ""
}

NR > end {exit}

NR == 1 {
    print FILENAME " :\n"
}

NR >= begin {
    if ($0 ~ pattern) 
        print NR ":" $0
}

Chame assim:

./rangegrep 1500 2000 'declare var testing' sample*.txt

A string de pesquisa pode ser uma expressão regular.

Editar:

Mudei de intervalo para verificar o número da linha para usar exit como em resposta do akira desde que o exit parará de processar linhas no final do intervalo e economizará tempo por não ler o resto das linhas no arquivo.

    
por 25.01.2011 / 09:33
3

awk faz o que você quer:

% awk 'NR < 1500 { next }; NR > 2500 { exit}; \
    /pattern/ { printf("%s:\n%d:%s\n", FILENAME, NR, $0); }' \
    sample_*.txt

para ter o máximo de espaço que você forneceu na saída desejada, você só precisa adicionar quantos \n à instrução printf ...

    
por 25.01.2011 / 08:59
0

Sem usar awk como sobre algum script de shell + sed :

for f in sample_*.txt ; do echo "$f : " ; \
    sed -ne '1500,2500{/pattern/{=;p}}' $f ; \
    echo ; \
done
    
por 25.01.2011 / 16:59
0

Em Purely In The Interests of Science, eu apresento uma implementação de torso , o meio lógico entre head e tail .

Na prática, como outros notaram, isso é realmente desnecessário, já que você pode obter a saída desejada por uma combinação trivial de head e tail .

#!/bin/sh

usage () {
    printf "$0: $0 [-c <byte> -C <byte>] [-n <line> -N <line>] file [file ... ]\n"
}

while [ $# -gt 0 ] ; do
    case "$1" in
            -c|--byte-start) shift ; start="$1" ; mode=byte ; shift ;;
            -C|--byte-end) shift ; end="$1" ; mode=byte ; shift ;;
            -n|--line-start) shift ; start="$1" ; mode=line ; shift ;;
            -N|--line-end) shift ; end="$1" ; mode=line ; shift ;;
                --) shift ;;
            -*) printf "bad option '%s'\n" "$1" ; usage ; exit 201 ;;
                *) files=("${files[@]}" "$1") ; shift ;;
         esac
done

if [ $start -gt $end ] ; then
    printf "end point cannot be before start point\n"
    usage
    exit 202
fi

head_cmd=
tail_cmd=
end=$((end - start))
if [ $mode = "line" ] ; then
    head_cmd="-n $end"
    tail_cmd="-n +$start"
elif [ $mode = "byte" ] ; then
    head_cmd="-c $end"
    tail_cmd="-c +$start"
fi

if [ ${#files[@]} -eq 0 ] ; then
    cat - | tail $tail_cmd | head $head_cmd
else
    tail $tail_cmd "${files[@]}" | head $head_cmd
fi

Para manter a atualidade, veja como usar o torso para resolver a questão:

torso -n 1500 -N 2500 input_file | grep -n "test"

Ou para saída em conformidade com os requisitos

for file in sample_{1,2,7,10} ; do
     printf "\n\n%s:\n\n" "$file"
     torso -n 1500 -N 2500 "$file" | grep -n "test"
done

Você pode começar suas críticas ... agora!

    
por 25.01.2011 / 20:35

Tags