O HTTP não tem realmente uma noção de diretórios. As barras diferentes das três primeiras ( http://example.com/
) não têm nenhum significado especial, exceto em relação a ..
em URLs relativas. Então, a menos que o servidor siga um formato específico, não há como “baixar todos os arquivos no diretório especificado”.
Se você quiser fazer o download de todo o site, sua melhor opção é percorrer todos os links da página principal de forma recursiva. Onda não pode fazer isso, mas você pode. Isso funcionará se o site não for muito dinâmico (em particular, o wget não verá links construídos por código Javascript). Comece com wget -r http://example.com/
e procure em “Recursive Retrieval Options” e “Recursive Accept / Reject Options” no manual do wget para opções mais relevantes (profundidade de recursão, listas de exclusão, etc.).
Se o site tentar bloquear downloads automáticos, talvez seja necessário alterar a sequência do agente do usuário ( -U Mozilla
) e ignorar robots.txt
(criar um arquivo vazio example.com/robots.txt
e usar a opção -nc
para que O wget não tenta baixá-lo do servidor).