Estou tentando espelhar um site com wget
. Funciona muito bem até que ocorra uma coisa estranha.
Estou usando esta linha:
wget -e robots=off --wait 1 -l5 --mirror --convert-links --adjust-extension --page-requisites --no-parent --no-clobber -x -nH http://www.site.info/city
Na primeira página há um link "Om" (que é sueco para "About"). É como um banner que segue qualquer página do site. Então, se eu estiver na página inicial www.site.info/city
e clicar em "Om", eu vou estar ligado a www.site.info/city/om
onde é claro que uma oportunidade para clicar em "Om" está presente no banner.
No entanto, wget
continuará a seguir esse link "Om" em todas as páginas (mesmo que eu só queira que isso seja feito na primeira ocorrência). Eventualmente, será assim:
Återanvänder befintlig anslutning till www.site.info:80.
Como faço para parar / alterar esse comportamento de wget
?
Tags wget