Curl e grep texto em html

0

Existe uma maneira de enviar o texto html de uma solicitação de curl e obter o valor que está entre duas tags html?

Mais especificamente, o valor de entrada de um formulário?

    
por chrisjlee 24.06.2011 / 17:39

2 respostas

2

Você pode ler o conteúdo de html baixado via curl , usando uma mistura dos comandos regulares do UNIX (então grep , awk , etc.) Exatamente como depende exatamente da aparência do formulário e de como você quero interpretar isso.

Você também pode fazer isso com perl e outras linguagens que possuem bibliotecas que facilitam isso.

No entanto, os formulários de entrada só têm conteúdo nos campos quando alguma pessoa ou processo a preenche em localmente antes de enviá-la por meio de uma solicitação POST (ou menos provável uma GET).

Os formulários de entrada podem ter valores padrão obviamente, mas parece que o que você está perguntando é se você pode de alguma forma extrair os dados de um formulário que foi preenchido, a resposta não é de enrolar, porque curl pergunta ao servidor da Web a página da web e você recebe um formulário vazio.

Talvez você possa esclarecer o que está tentando alcançar.

    
por 24.06.2011 / 17:54
0

Existe

Eles são inspirados pelo json parser jq e oferecem sintaxe e comportamento semelhantes:

curl -s https://news.ycombinator.com/ | pup 'table table tr:nth-last-of-type(n+2) td.title a attr{href}'
    
por 24.03.2016 / 19:25