não pode abrir arquivos .gzip recuperados com wget

0

Estou tentando baixar o conteúdo de um diretório hospedado em um servidor usando o wget em um terminal cygwin. Eu não tenho nenhum problema em obter os arquivos, mas eles são todos arquivos .gz e uma vez baixados, eles são impossíveis de abrir ... aqui está a linha que estou usando:

wget -rnH --cut-dir=5 --header="Accept-Encoding:gzip" "http://someHost/bla/bli/bla/bla/2014/0254_REV2"

Alguém tem alguma ideia de como recuperar um arquivo utilizável usando o wget?

Qualquer ajuda seria apreciada, obrigado antecipadamente por pensar nisso;)

    
por user2227181 08.09.2014 / 16:16

1 resposta

0

Encontrei este :

Se você solicitar o conteúdo gzip'ed (usando o cabeçalho accept-encoding: gzip, que está correto), então eu entendo que o wget não pode ler o conteúdo. Então você vai acabar com um único arquivo gzipado no disco, para a primeira página que você acertar, mas nenhum outro conteúdo.

i.e. você não pode usar o wget para solicitar conteúdo com gzip e para reciclar todo o site ao mesmo tempo.

Acho que há um patch que permite ao wget suportar essa função, mas não está na versão de distribuição padrão.

Se você incluir o sinalizador -S, poderá saber se o servidor da Web está respondendo com o tipo correto de conteúdo. Por exemplo,

wget -S --header="accept-encoding: gzip" wordpress.com
    
por 08.09.2014 / 16:22

Tags