Este é um arquivo compactado gzip . Você pode descobrir isso executando o comando file
, que calcula o formato do arquivo de números mágicos nos dados (é assim que programas como o Text Wrangler descobrem que o arquivo também é compactado):
file output.html
wget -O - … | file -
O servidor (eu adivinhei do conteúdo que você mostrou) está enviando dados compactados e configurando corretamente o cabeçalho
Content-Encoding: gzip
mas o wget não suporta isso. Em versões recentes, wget envia Accept-encoding: identity
, para informar ao servidor para não compactar ou codificar os dados. Nas versões mais antigas, você pode enviar o cabeçalho manualmente:
wget --header 'Accept-encoding: identity' …
No entanto, este servidor específico parece estar corrompido: ele envia dados compactados mesmo quando solicitado a não codificar os dados de forma alguma. Então você terá que descomprimir os dados manualmente.
wget -O output.html.gz … && gunzip output.html.gz