Gostaria de espelhar uma página da web de forma recursiva, mas ela usa links de javascript, como "javascript:readArticle(x)"
. Eu sei que esses links são simplesmente traduzidos em um URL, digamos "/articles/read?id=x"
, posso dizer ao wget para "traduzir" esses links antes de continuar a fazer o download?
Não estou sugerindo que o wget interprete o javascript.
Existe uma maneira de fazer o wget baixar uma página, alterar esses links (talvez usando sed
?) e, em seguida, continuar o download seguindo os novos links?
Tags wget