Tente isso (o gawk é necessário).
awk '{a=gensub(/.*#([0-9]+)(\").*/,"\1","g",$0);if(a~/[0-9]+/) {gsub(/[0-9]+\"/,a+11"\"",$0);}print $0}' YourFile
Teste com o seu exemplo:
kent$ echo '(bookmarks
("Chapter 1 Introduction 1" "#1"
("1.1 Problem Statement and Basic Definitions 2" "#2")
("Exercises 30" "#30")
("Notes and References 34" "#34"))
)
'|awk '{a=gensub(/.*#([0-9]+)(\").*/,"\1","g",$0);if(a~/[0-9]+/) {gsub(/[0-9]+\"/,a+11"\"",$0);}print $0}'
(bookmarks
("Chapter 1 Introduction 12" "#12"
("1.1 Problem Statement and Basic Definitions 13" "#13")
("Exercises 41" "#41")
("Notes and References 45" "#45"))
)
Note que este comando não funcionará se os dois números (por exemplo, 1 "e" # 1 ") forem diferentes, ou se houver mais números na mesma linha com este padrão (por exemplo, 23" ... 32 ". "# 123") em uma linha.
UPDATE
Como @Tim (OP) disse que o número seguido por "
na mesma linha poderia ser diferente, fiz algumas alterações na minha solução anterior e fiz com que funcionasse para o seu novo exemplo.
BTW, pelo exemplo, sinto que poderia ser uma tabela de estrutura de conteúdo, então não vejo como os dois números poderiam ser diferentes. O primeiro seria o número da página impressa e o segundo com o # seria o índice da página. Estou certo?
De qualquer forma, você conhece melhor sua exigência. Agora a nova solução, ainda com o gawk (eu quebro o comando em linhas para facilitar a leitura):
awk 'BEGIN{FS=OFS="\" \"#"}{if(NF<2){print;next;}
a=gensub(/.* ([0-9]+)$/,"\1","g",$1);
b=gensub(/([0-9]+)\"/,"\1","g",$2);
gsub(/[0-9]+$/,a+11,$1);
gsub(/^[0-9]+/,b+11,$2);
print $1,$2
}' yourFile
test com seu exemplo novo :
kent$ echo '(bookmarks
("Chapter 1 Introduction 1" "#1"
("1.1 Problem Statement and Basic Definitions 23" "#2")
("Exercises 31" "#30")
("Notes and References 42" "#34"))
)
'|awk 'BEGIN{FS=OFS="\" \"#"}{if(NF<2){print;next;}
a=gensub(/.* ([0-9]+)$/,"\1","g",$1);
b=gensub(/([0-9]+)\"/,"\1","g",$2);
gsub(/[0-9]+$/,a+11,$1);
gsub(/^[0-9]+/,b+11,$2);
print $1,$2
}'
(bookmarks
("Chapter 1 Introduction 12" "#12"
("1.1 Problem Statement and Basic Definitions 34" "#13")
("Exercises 42" "#41")
("Notes and References 53" "#45"))
)
EDIT2 baseado no comentário de @Tim
(1) Does FS=OFS="\" \"#" mean the separator of field in both input and output is double quote, space, double quote and #? Why specify double quote twice?
Você está certo para o separador na parte de entrada e saída. Definiu o separador como:
" "#
Existem duas aspas duplas, porque é mais fácil capturar os dois números desejados (com base na sua entrada de exemplo).
(2) In /.* ([0-9]+)$/, does $ mean the end of the string?
Exatamente!
(3) In the third argument of gensub(), what is the difference between "g" and "G"? there is no difference between G and g. Check this out:
gensub(regexp, replacement, how [, target]) #
Search the target string target for matches of the regular expression regexp.
If "how" is a string beginning with ‘g’ or ‘G’ (short for “global”), then
replace all matches of regexp with replacement.
Isso é do link . você pode ler para obter um uso detalhado do gensub.