Wget falha ao baixar arquivos PNG do Blogger

3

Estou tentando espelhar um site de blogger para que eu possa ter uma cópia exata dele no meu sistema de arquivos para ver. Eu tentei emitir o seguinte comando no Linux:

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/

Eu até tentei usar o sinalizador -D para listar uma lista separada por vírgulas de domanins a seguir (preferiria apenas seguir qualquer domínio embora sem ter que especificar todos eles). Eu até tentei mudar a parte .com do URL para o domínio de nível superior do meu país (.it) (sem o qual, por algum motivo Eu não entendo e gostaria de saber, wget recupera apenas index.html e nenhuma outra página, talvez alguém aqui possa explicar por quê).

Então, mesmo quando eu faço um

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/

vários HTML e também o favicon.ico são baixados, mas nenhum dos .png imagens do blogger são baixadas. Por que isso é assim e como posso obter wget para funcionar corretamente. Eu li a man page do wget mas não tive sorte.

Obrigado.

    
por John Sonderson 04.10.2013 / 02:27

2 respostas

4

Como jayhendren sugeriu, tentei listar o domínio bp.blogspot.com na lista seguindo o sinalizador -D. No entanto, o que eu esqueci de fazer é adicionar o sinalizador -H. Por que o wget requer que o sinalizador extra -H seja adicionado separadamente da lista de domínios a seguir com o sinalizador -D não está claro para mim, mas funciona. Aqui está o comando que eu especifiquei para espelhar o site do Blogger, incluindo as imagens veiculadas do domínio externo:

wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
  --wait 0.5 --convert-links http://yoursitehere.blogspot.it/

Nota: isso funciona na Itália. Converta .it para .com ou para qualquer outro domínio de nível superior, se você quiser que isso funcione a partir de sua localização.

Atenciosamente.

    
por 12.10.2013 / 14:00
0

Sem saída de erro do wget, não posso dizer qual é o problema exato que você tem. Mas geralmente ao baixar (ou espelhar um site) com o wget, eu vou usar a opção -mirror assim:

wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/
    
por 04.10.2013 / 02:38

Tags