Por que o wget continua buscando recursivamente apesar de -l5?

1

Estou tentando espelhar um site com wget . Funciona muito bem até que ocorra uma coisa estranha.

Estou usando esta linha:

wget -e robots=off --wait 1 -l5 --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-clobber -x -nH http://www.site.info/city

Na primeira página há um link "Om" (que é sueco para "About"). É como um banner que segue qualquer página do site. Então, se eu estiver na página inicial www.site.info/city e clicar em "Om", eu vou estar ligado a www.site.info/city/om onde é claro que uma oportunidade para clicar em "Om" está presente no banner.

No entanto, wget continuará a seguir esse link "Om" em todas as páginas (mesmo que eu só queira que isso seja feito na primeira ocorrência). Eventualmente, será assim:

http://www.site.info/city/om/nu/132-walk-of-fame/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/om/newsmail

Återanvänder befintlig anslutning till www.site.info:80.

Como faço para parar / alterar esse comportamento de wget ?

    
por Paul Bergström 28.06.2017 / 09:56

0 respostas

Tags