Wget me fornece nomes de arquivos como “index.html? foo = bar”, mas o navegador sempre abre o arquivo “index.html”

1

Eu fiz o download do dump do site com o Wget (os links foram convertidos) e muitos arquivos têm nomes como este: index.html?foo=bar . A única maneira de abri-los é especificá-los diretamente como argumentos do navegador. Quando tento abri-los pelo link em outro arquivo, o arquivo aberto é apenas index.html . Eu tentei isso com o Firefox, Chromium, Elinks e Lynx. O Lynx é o único, que funciona corretamente, mas nem sempre consigo usá-lo, porque tem certos problemas . A única solução que consigo pensar é renomear todos os arquivos e converter todos os links neles, mas não parece conveniente.

Existe algo que eu possa fazer para tornar os navegadores (preferencialmente o Firefox) abrirem esses arquivos por links?

UPD: O problema persiste somente quando tento abrir o arquivo seguindo o link em outro arquivo ou abri-lo na barra de endereços. Portanto, os navegadores se comportam como parte depois que ? não faz parte do nome, mas de alguns dados para o servidor. Talvez haja uma opção para escapar desses caracteres por padrão e seguir links literalmente?

    
por Epsylon 23.01.2016 / 17:24

1 resposta

0

Parece que o site que você espelhou está manipulando .html de uma maneira especial. Normalmente, isso seria HTML estático sem qualquer script do lado do servidor, que é passado como armazenado no disco por um servidor da Web.

O argumento ?foo=bar não tem efeito no HTML estático. Se isso funcionar no site ativo, sugeriria que .html arquivos nesse servidor sejam realmente manipulados com um processador de scripts.

Isso resulta em você ter a saída renderizada do script usando wget em vez do script que gerou a saída. Como você não possui o script real, a saída pode ser diferente se a saída dos scripts for diferente, dado os argumentos.

    
por 23.01.2016 / 17:31