usando o awk para fazer correspondências exatas

0

Estou apenas imaginando como podemos usar o awk para fazer correspondências exatas.

por exemplo,

$ cal 09 09 2009
   September 2009
Su Mo Tu We Th Fr Sa
   1  2  3  4  5
6  7  8  9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30



$ cal 09 09 2009 | awk '{day="9"; col=index($0,day); print col }'
17
0
0
11
20
0
8
0

Como você pode ver, o comando acima mostra o número de índice de todas as linhas que contêm a string / número "9", existe uma maneira de fazer o número do índice de saída awk apenas na quarta linha de saída acima. ? pode ser uma solução ainda mais elegante?

Estou usando o awk para obter o nome do dia usando o comando cal. aqui está toda a linha de código:

     $ dayOfWeek=$(cal $day $month $year | awk '{day='$day'; split("Sunday Monday Tuesday Wednesday Thursday Friday Saturday", array); column=index($o,day); dow=int((column+2)/3); print array[dow]}')

O problema com o código acima é que, se várias correspondências forem encontradas, eu obtenho vários resultados, ao passo que quero que ele produza apenas um resultado.

Obrigado!

    
por Jasdeep Singh 07.03.2011 / 20:23

4 respostas

0

Você poderia grep da saída de cal para fornecer apenas uma linha:

$ cal 09 09 2009 | grep -E '(^9 | 9 | 9$)' | awk ...

O grep corresponde a um dos seguintes:

  • A 9 seguido por um espaço no início da linha
  • A 9 cercado por espaços
  • Um espaço seguido por um 9 no final da linha.

Como é esse trabalho para você?

    
por 07.03.2011 / 20:35
0

Eu faria isso com algo como

dayOfWeek="$(cal $month $year |
             awk -v day=$day \
                'BEGIN {split("Sunday Monday Tuesday Wednesday Thursday Friday Saturday", days)}
                 NR > 2 {for (i = 1; i <= NF; i++) {if ($i == day) {print days[i]}}}')"

Aqui, BEGIN é executado no início para configurar a matriz days ; o outro padrão dispara nas linhas 2 e acima (ignorando o cabeçalho), percorre as colunas até encontrar day e, em seguida, usa o número da coluna para pesquisar o dia da semana. $ in awk é o operador de referência de campo; Assim como $1 é o primeiro campo, $n é o campo numerado pelo valor de n . Também estou passando $ dia do shell para o script com a atribuição no início da linha awk . NR é o número do registro (número da linha); NF é o número de campos na linha. (Você pode definir RS e FS , respectivamente, para alterar o que separa registros e campos, respectivamente.)

(A barra invertida-newlines e a nova linha após o pipe | são apenas para clareza e para fazer com que ela não role muito muito.)

Desta vez, foi testado.

    
por 07.03.2011 / 20:59
0

o script desta página faz exatamente isso

link

    
por 07.03.2011 / 21:42
0

Experimente:

cal 09 2009 | awk -v "num=9" '
    BEGIN {
        OFS="\t";
        day=" ?[^0-9]" num "([^0-9]|$)"
    }
    NR==2 {dow = $0}
    $0 ~ day {
        col=match(" " $0, day);
        print $0, col, substr(dow,col,2)
    }'

Tudo em uma linha:

cal 09 2009 | awk -v "num=9" 'BEGIN {OFS="\t"; day=" ?[^0-9]" num "([^0-9]|$)"} NR==2 {dow = $0} $0 ~ day {col=match(" " $0, day); print $0, col, substr(dow,col,2) }'

Demo:

$ for i in {1..30}; do cal 09 2009 | awk -v "num=$i" 'BEGIN {OFS="\t"; day=" ?[^0-9]" num "([^0-9]|$)"} NR==2 {dow = $0} $0 ~ day {col=match(" " $0, day); print $0, num, col, substr(dow,col,2) }'; done
       1  2  3  4  5    1       7       Tu
       1  2  3  4  5    2       10      We
       1  2  3  4  5    3       13      Th
       1  2  3  4  5    4       16      Fr
       1  2  3  4  5    5       19      Sa
 6  7  8  9 10 11 12    6       1       Su
 6  7  8  9 10 11 12    7       4       Mo
 6  7  8  9 10 11 12    8       7       Tu
 6  7  8  9 10 11 12    9       10      We
 6  7  8  9 10 11 12    10      13      Th
 6  7  8  9 10 11 12    11      16      Fr
 6  7  8  9 10 11 12    12      19      Sa
13 14 15 16 17 18 19    14      4       Mo
13 14 15 16 17 18 19    15      7       Tu
13 14 15 16 17 18 19    16      10      We
13 14 15 16 17 18 19    17      13      Th
13 14 15 16 17 18 19    18      16      Fr
13 14 15 16 17 18 19    19      19      Sa
20 21 22 23 24 25 26    21      4       Mo
20 21 22 23 24 25 26    22      7       Tu
20 21 22 23 24 25 26    23      10      We
20 21 22 23 24 25 26    24      13      Th
20 21 22 23 24 25 26    25      16      Fr
20 21 22 23 24 25 26    26      19      Sa
27 28 29 30             28      4       Mo
27 28 29 30             29      7       Tu
27 28 29 30             30      10      We

Aqui está uma melhoria no script ao qual Mohamed se vinculou:

cal 09 2009 | awk -v "d=9" 'NR==2 {split($0, dow)} NR == 3 {print $0, d, dow[7 - ($NF + 35 - d) % 7]}'

Não há necessidade de head , tail ou um monte de if declarações.

    
por 07.03.2011 / 22:11

Tags