Wget sobrescreve arquivos ao espelhar um site multilíngue

1

Eu gostaria de espelhar um site usando o wget. O problema é que o site tem várias mutações de idioma que são trocadas usando um parâmetro de string de consulta e quando o wget começa a baixar outra versão de idioma, isso atrapalha o anterior. Por exemplo, ele começa com index.html, pega uma parte do site, depois encontra um link para index.html? Lang = foo, inicia o download de uma nova variante de idioma e sobrescreve o index.html anterior com o novo. O que posso fazer quando quero todos eles?

    
por zoul 15.12.2009 / 15:20

1 resposta

1

Como as páginas são realmente as mesmas, não tenho muita certeza ...

Você pode experimentar o HTTrack , que é uma copiadora de websites muito flexível e pode configurar regras como excluir caminhos / páginas com uma determinada consulta string ... Ou pode realmente ser capaz de baixar todos os idiomas, não tenho 100% de certeza, pois não corri para este problema.

    
por 15.12.2009 / 15:24

Tags