recursivamente baixando todas as pastas e subpastas da página da Web

1

Eu gostaria de baixar um diretório da página da web. Eu estou tentando fazer usando wget e rastreamento, mas eu não sou capaz de baixar o diretório inteiro como estava lá na página web ou de qualquer outra forma. suponha que a página da web seja abcd.com/ddd/bbb/A. dentro A há informações relevantes que começam com A. meu alvo é baixar o que sempre o arquivo está lá em A, ou seja, baixar recursivamente todas as subpastas em A, se disponível.

    
por raja 28.05.2013 / 14:20

1 resposta

0

Se todos os documentos estiverem acessíveis por meio de links HTML simples, o seguinte deverá funcionar:

wget -np -r -l0 http://abcd.com/ddd/bbb/A/

Isto assume que A é um diretório; se não for, você deve omitir a barra final e aceitar o download de tudo em bbb .

-np omite diretórios pai. -r alterna os downloads recursivos e -l0 seleciona a profundidade infinita do download. Este último é, obviamente, arriscado no caso de haver infinitas ligações simbólicas ou construções semelhantes. Portanto, pode ser mais seguro incluir uma estimativa razoável da cadeia máxima de links necessária para alcançar todos os documentos desejados. Eu geralmente uso -l5 .

    
por 28.05.2013 / 14:31