Você pode usar grep
para esse e seu único parâmetro de correspondência ( -o
), por exemplo:
$ grep -o "<[^>]*>" <(curl -s http://example.com/)
Isso imprimirá todas as tags html, incluindo o pedido.
Para incluir apenas as tags <script>
, tente (altere index.html
com seu arquivo):
$ grep -Eo "<script.*(</script>|>)" index.html
Para obter apenas os nomes de arquivo (do atributo src
), você pode estender adicionando outro grep
, por exemplo:
$ grep -Eo "<script.*(</script>|>)" index.html | grep -o '"[^"]*"' | tr -d '"'
A sintaxe acima não o ajudará com muitas variações diferentes de código html, portanto, para soluções mais complexas, usando o regex para analisar o html em geral não é recomendado, portanto, você deve usar ferramentas apropriadas (idioma de sua preferência ou confira estas ferramentas de shell ).