Sem tentar detectar entradas problemáticas (por exemplo, link ou texto contendo []
), apenas capture tudo entre "…"
e entre >…</a>
:
sed -e 's!<a *href *= *"\([^"]*\)" *>\([^<>]*\)</[Aa]>![ ]!g'
Apenas para editar o Wiki ..
Então eu tenho essa entrada [de um texto de larget]:
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT <a href="http://xy.com">XY</a> RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
e eu quero essa saída:
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT [http://xy.com XY] RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
TEXT TEXT BLA-BLA RANDOMSTRINGS BLA-BLA
"http://xy.com" pode ser, por exemplo: "https://xy.com" ou "http://www.xy.com" ou "https://www.xy.com", etc.
Tags text-processing perl sed