lcomma() { sed '
$x;$G;/\(.*\),/!H;//!{$!d
}; $!x;$s///;s/^\n//'
}
Isso deve remover apenas a última ocorrência de um ,
em qualquer arquivo de entrada - e ainda imprimirá aqueles nos quais ,
não ocorre. Basicamente, ele armazena em seqüência seqüências de linhas que não contêm vírgulas.
Quando ele encontra uma vírgula, ele troca o buffer de linha atual pelo buffer de retenção e, dessa forma, imprime simultaneamente todas as linhas que ocorreram desde a última vírgula e libera seu buffer de retenção.
Eu estava apenas pesquisando meu arquivo de histórico e achei isso:
lmatch(){ set "USAGE:\
lmatch /BRE [-(((s|-sub) BRE)|(r|-ref)) REPL [-(f|-flag) FLAG]*]*
" "${1%"${1#?}"}" "$@"
eval "${ZSH_VERSION:+emulate sh}"; eval '
sed " 1x; \$3$2!{1!H;\$!d
}; \$3$2{x;1!p;\$!d;x
}; \$3$2!x;\$3$2!b'"
$( unset h;i=3 p=:-:shfr e='3[' m=$(($#+1)) f=OPTERR
[ -t 2 ] && f=$eK$e'1;41;17m}\r${h-'$f$eprintf "%d\" %d' %d\" %d'\n" $(seq 5 5 200) |
tee /dev/fd/2 |
lmatch d^.0 \ #all re's delimit w/ d now
-r '&&&&' \ #-r or --ref like: '...s//$ref/...'
--sub \' sq \ #-s or --sub like: '...s/$arg1/$arg2/...'
--flag 4 \ #-f or --flag appended to last -r or -s
-s\" \dq \ #short opts can be '-s $arg1 $arg2' or '-r$arg1'
-fg #tacked on so: '...s/"/dq/g...'
m
f='\${$m?"\"${h-'$f':\t\${$i$e\n}\\""}\c' e=} _o=
o(){ IFS=\ ;getopts $p a "$1" &&
[ -n "${a#[?:]}" ] &&
o=${a#-}${OPTARG-${1#-?}} ||
! eval "o=$f;o=\${o%%*\{$m\}*}"
}; a(){ case ${a#[!-]}$o in (?|-*) a=;;esac; o=
set $* "${3-$2$}{$((i+=!${#a}))${a:+#-?}}"\
${3+$2 "{$((i+=1))$e"} $2
IFS=$; _o=${_o%"${3+$_o} "*}$*\
}; while eval "o \"\${$((i+=(OPTIND=1)))}\""
do case ${o#[!$a]} in
(s*|ub) a s 2 '' ;;
(r*|ef) a s 2 ;;
(f*|lag) a ;;
(h*|elp) h= o; break ;;
esac; done; set -f; printf "\t%b\n\t" $o $_o
)\"";}
É realmente muito bom. Sim, ele usa eval
, mas nunca passa nada além de uma referência numérica aos seus argumentos. Ele cria scripts sed
arbitrários para manipular uma última correspondência. Eu vou te mostrar:
5" 10' 15" 20'
25" 30' 35" 40'
45" 50' 55" 60'
65" 70' 75" 80'
85" 90' 95" 100'
105" 110' 115" 120'
125" 130' 135" 140'
145" 150' 155" 160'
165" 170' 175" 180'
185" 190' 195" 200'
Isso imprime o seguinte para stderr. Esta é uma cópia da entrada de lmatch
:
... sed " 1x;\$2$1!{1!H;\$!d
}; \$2$1{x;1!p;\$!d;x
}; \$2$1!x;\$2$1!b
s$1$1${4}$1
s$1${6}$1${7}$1${9}
s$1${10#-?}$1${11}$1${12#-?}
"
++ sed ' 1x;\d^.0d!{1!H;$!d
}; \d^.0d{x;1!p;$!d;x
}; \d^.0d!x;\d^.0d!b
sdd&&&&d
sd'\''dsqd4
sd"d\dqdg
'
A subcamada eval
ed da função itera todos os seus argumentos uma vez. À medida que ele passa por cima deles, itera um contador apropriadamente, dependendo do contexto de cada opção, e ignora esses muitos argumentos para a próxima iteração. A partir de então, faz uma das poucas coisas por argumento:
- Para cada opção, o analisador de opções adiciona
$a
a $o
. $a
é atribuído com base no valor de $i
, que é incrementado pela contagem de argumentos para cada argumento processado. $a
recebe um dos dois valores a seguir:
-
a=$((i+=1))
- isso é atribuído se uma opção curta não tiver seu argumento anexado a ela ou se a opção for longa.
-
a=$i#-?
- isso é atribuído se a opção é curta e faz ter seu argumento anexado a ela.
-
a=\${$a}${1:+$d\${$(($1))\}}
- Independentemente da atribuição inicial, o valor de $a
é sempre agrupado em chaves e - em -s
caso - às vezes $i
é incrementado mais uma vez e o campo adicionalmente delimitado é acrescentado.
O resultado é que eval
nunca é passado uma string contendo quaisquer incógnitas. Cada um dos argumentos da linha de comando é referenciado por seu número numérico de argumento - até mesmo o delimitador que é extraído do primeiro caractere do primeiro argumento e é a única vez em que você deve usar qualquer caractere que esteja sem escape. Basicamente, a função é um gerador de macro - ele nunca interpreta os valores dos argumentos de maneira especial porque sed
pode (em, claro) lidar facilmente com isso quando analisa o script. Em vez disso, apenas organiza sensatamente seus argumentos em um script viável.
Aqui está uma saída de depuração da função no trabalho:
5" 10' 15" 20'
25" 30' 35" 40'
45" 50' 55" 60'
65" 70' 75" 80'
85" 90' 95" 100'
101010105dq 110' 115dq 120'
125dq 130' 135dq 140sq
145dq 150' 155dq 160'
165dq 170' 175dq 180'
185dq 190' 195dq 200'
E assim lmatch
pode ser usado para aplicar regexes facilmente aos dados após a última correspondência em um arquivo. O resultado do comando que eu corri acima é:
printf "%d, %d %d, %d\n" $(seq 5 5 100) |
lmatch '/\(.*\),' -r\1
... que, dado o subconjunto da entrada do arquivo que segue a última vez que /^.0/
é correspondido, aplica as seguintes substituições:
-
sdd&&&&d
- substitui $match
por si mesmo 4 vezes.
-
sd'dsqd4
- a quarta aspa simples após o início da linha desde a última correspondência.
-
sd"d\dqd2
- idem, mas para aspas duplas e globalmente.
E assim, para demonstrar como alguém pode usar lmatch
para remover a última vírgula em um arquivo:
5, 10 15, 20
25, 30 35, 40
45, 50 55, 60
65, 70 75, 80
85, 90 95 100
OUTPUT:
lcomma() { sed '
$x;$G;/\(.*\),/!H;//!{$!d
}; $!x;$s///;s/^\n//'
}