recursivamente baixando todas as pastas e subpastas da página da Web

Question

recursivamente baixando todas as pastas e subpastas da página da Web

#1 resposta do (0 votos)

1

Eu gostaria de baixar um diretório da página da web. Eu estou tentando fazer usando wget e rastreamento, mas eu não sou capaz de baixar o diretório inteiro como estava lá na página web ou de qualquer outra forma. suponha que a página da web seja abcd.com/ddd/bbb/A. dentro A há informações relevantes que começam com A. meu alvo é baixar o que sempre o arquivo está lá em A, ou seja, baixar recursivamente todas as subpastas em A, se disponível.

wget web-crawler

por raja 28.05.2013 / 12:20

1 resposta

Tags wget web-crawler

Altere a porta UDP com iptables para clientes VPN O teclado desativa o campo quando eu uso o Caps Lock?

score 0 · Answer 1

Se todos os documentos estiverem acessíveis por meio de links HTML simples, o seguinte deverá funcionar:

wget -np -r -l0 http://abcd.com/ddd/bbb/A/

Isto assume que A é um diretório; se não for, você deve omitir a barra final e aceitar o download de tudo em bbb .

-np omite diretórios pai. -r alterna os downloads recursivos e -l0 seleciona a profundidade infinita do download. Este último é, obviamente, arriscado no caso de haver infinitas ligações simbólicas ou construções semelhantes. Portanto, pode ser mais seguro incluir uma estimativa razoável da cadeia máxima de links necessária para alcançar todos os documentos desejados. Eu geralmente uso -l5 .