Fazendo o download de um site grande com o wget

1

Estou tentando espelhar um site muito grande, mas o wget nunca parece terminar corretamente. Eu estou usando o comando:

wget -r -l inf -nc -w 0.5 {the-site}

Eu baixei uma boa parte do site, mas não a coisa toda. O conteúdo não muda rápido o suficiente para se incomodar com o registro de data e hora.

Depois de passar a noite, esta mensagem aparece:

File '{filename}.html' already there; not retrieving.
File '{filename}.html' already there; not retrieving.
File '{filename}.html' already there; not retrieving.
File '{filename}.html' already there; not retrieving.
Killed

Alguém sabe o que está acontecendo e como posso corrigi-lo?

    
por Evan Gill 15.06.2010 / 18:09

1 resposta

1

Já experimentou o a opção ' -m ' ?
é um atalho para

-N -r -l inf --no-remove-listing

Você também pode experimentar especificamente com o site usando uma URL mais profunda para um conjunto limitado de arquivos e evitar a busca de caminhos pai com

-np

    
por 15.06.2010 / 18:17