Download recursivamente de links com uma verificação de segurança, resultando em um redirecionamento de loop.
O comando não está funcionando porque o seu site usa o redirecionamento duplo que confunde o wget. Vamos ver o log detalhado que pode ser invocado com a opção --debug
(linhas irrelevantes removidas):
---request begin---
GET /<URL> HTTP/1.1
---response begin---
HTTP/1.1 302 Found
Location: https://community.lego.com/auth/securityCheck?action=bounce&referrer=https%3A%2F%2Fcommunity.lego.com%2F<URL>
(...)
---request begin---
GET /auth/securityCheck?referrer=https%3A%2F%2Fcommunity.lego.com%2F<URL> HTTP/1.1
---response begin---
HTTP/1.1 302 Found
Location: https://community.lego.com/<URL>
(...)
Deciding whether to enqueue "https://community.lego.com/<URL>".
Already on the black list.
Decided NOT to load it.
Redirection "https://community.lego.com/<URL>" failed the test.
Como visto, ele envia seu pedido para uma "verificação de segurança" e volta. O Wget não espera ser redirecionado pela segunda vez para a mesma página que você veio, e trata-o como uma lista negra, portanto, não segue nenhum link.
Embora seja absolutamente possível que haja uma maneira de fazer alguma mágica de cookie para fazer com que o redirecionamento da verificação de segurança não aconteça, eu não sei como fazer isso.
No entanto, se você estiver disposto a recompilar o wget manualmente, a correção para o seu problema pode ser trivial: basta adicionar essas duas linhas em src/recur.c
.
status = retrieve_url (url_parsed, url, &file, &redirected, referer,
&dt, false, i, true);
+
+ if (redirected)
+ hash_table_remove (blacklist, url);
if (html_allowed && file && status == RETROK
&& (dt & RETROKF) && (dt & TEXTHTML))
Isso removerá a página atual da lista negra toda vez que você for redirecionado, corrigindo assim o seu problema.
Esteja avisado que isso pode provocar loops infinitos em alguns casos, por isso não é um patch pronto para envio.
Depois de reconstruir o wget, você pode usar algo como %código% para buscar todo o seu segmento conforme pretendido.