awk: como o código pode coletar substring

0

Perdoe-me se esta não é uma pergunta comum. Estou usando um código para obter a substring antes do n'th separador de campos:

echo '123-321-333-111-235'| awk -F"-" '
BEGIN {n=3}
{for(i=1;i<=n;++i)  
k = k (k=="" ? "" : FS) $i; 
print(k) 
}'

Isso dá

123-321-333

Eu não entendo como a linha k = k (k=="" ? "" : FS) $i; funciona. É o k=k e $i em torno do operador ternário que me intriga. Minha pergunta é simplesmente para obter uma explicação

    
por user3375672 26.02.2017 / 23:30

2 respostas

4
echo '123-321-333-111-235' |
awk -F'-' -v n=3 '
  {
     for( i=1; i<=n; ++i )
        k = k (k == "" ? "" : FS) $i
     ;
     print k
  }
'

O loop for é executado 3 vezes:

i=1:

 k is empty, $i -> $1 -> 123

 k <= empty ( empty == empty ? empty : "-" ) 123

 k <= empty empty 123

 k <= "123"

i=2:

 k is "123", $i -> $2 -> 321

 k <= "123" ( 123 == empty ? empty : "-" ) 321

 k <= "123" "-" "321"

 k <= "123-321" due to the implicit concatenation property of awk strings

i=3:

 k is "123-321", $i -> $3 -> 333

 k <= "123-321" ( 123-321 == empty ? empty : "-" ) 333

 k <= "123-321" "-" "333"

 k <= "123-321-333"

 This value of k is now sent to stdout.
 STOP.

Como alternativa, você também pode fazer o seguinte:

n=3

echo '123-321-333-111-235' | sed -ne "s/-/\n/$n;P"

echo '123-321-333-111-235' | perl -F- -lane "\$, = '-'; print @F[0..$n-1]"

( 
   var='123-321-333-111-235'
   set -f; IFS='-'; set -- $var

   for((i=1;i<=$n;i++))
   do
      v=${v-}${v:+"$IFS"}$1
   done
   echo "$v"

   # or, alternatively:
   N=$#
   while case $# in 'expr $N - $n' ) break ;; esac; do
     V=${V-}${V:+"$IFS"}$1
     shift
   done
   echo "$V"
)

var='123-321-333-111-235'
FS='-'; # field separator provided here
fields=$(yes "[^$FS]*$FS" | head -n $n | tr -d '\n')
result='expr "$var$FS" : "\($fields\)"'
echo "${result%?}"
    
por 27.02.2017 / 07:02
0

Se você tivesse k = k $i , adicionaria em cada iteração atualmente processado no final de k (assim você obteria: 123321333).

Se você tivesse k = k FS $i , você receberia -123-321-333.

O ternário se apenas se certificar, não há nenhum traço no começo, porque quando o processo do $ 1 do awk, k está vazio e, portanto, o ternário se retorna "".

    
por 27.02.2017 / 06:22

Tags