Citação de luta perdida com grep e sed

0

Estou escrevendo um script bash para extrair dados de tags html e encontrei este comando em outro thread: grep -o '<tr>.*</tr>' HTMLFILE | sed 's/\(<tr>\|<\/tr>\)//g' > NEWFILE , está funcionando muito bem.

Mas sei que quero extrair um nome de um link em uma tag <a> , como <a href="www.mywebsite.com?name="What_I_Want_To_Extract"> . Eu pensei muito, mas não consegui adaptar o comando abaixo, alguma ajuda?

    
por Zil0 15.08.2014 / 18:33

1 resposta

1

grep -oP 'name="\K[^"]*' filename

Saída:

What_I_Want_To_Extract

Veja: link

Sua versão adaptada:

grep -o 'name=".*">' HTMLFILE | sed 's/name="\|">//g' NEWFILE

    
por 15.08.2014 / 18:44