Como dizer ao wget para baixar arquivos com nomes codificados url?

4

Estou tentando baixar um site inteiro usando wget e esse é o comando que uso:

wget --recursive --no-clobber --page-requisites --convert-links --domains example.com --no-parent  http://www.example.com/en/

Está funcionando bem, mas há um problema. Existem arquivos (principalmente imagens) cujo nome contém caracteres chineses como este:

http://www.example.com/path/to/首页主KV3.jpg

Após o download, o arquivo foi salvo com este nome:

??%96页主KV3.jpg

E é endereçado na página html como este e, portanto, emitindo um erro 404:

�%2596页主KV3.jpg

Eu me pergunto como posso evitar essa inconsistência?!

    
por Hamed Momeni 28.12.2015 / 11:19

1 resposta

0

Eu lutei com isso hoje também.

No meu caso, o problema era com letras alemãs como "ä, ö, ü" ...

Eu consertei definindo TODAS as configurações de idioma para UTF-8.

Você pode ver um tutorial aqui:

link

    
por 14.07.2016 / 17:16