Simplesmente o site que estou baixando tem todos os links que terminam com &sid=335345346fdsfdsfs
. Isso continua mudando e cria um monte do mesmo index.html
e o mesmo para muitas outras páginas.
Eu me pergunto se alguém já lidou com problemas como este. Tudo que eu preciso é de sed -e 's/&sid=.*$//g'
.
http://foo.bar/&sid=yada
http://foo.bar
s/&sid=.*$//g
por links dentro do download .html
Se já houver alguma maneira inteligente de ignorar as variáveis GET incorporadas no nome do site, bem-vindo.