Wget com URL que contém #

Question

Wget com URL que contém #

Navegue suas respostas

#1 resposta do (20 votos)
#2 resposta do (8 votos)
#3 resposta do (0 votos)

11

Estou tentando fazer o download de um URL que é como http://www.somesite.com/restaurants.html#photo=22x00085 .

Eu coloco entre aspas simples, mas ele só baixa o link que não é a página correta.

Existe uma solução?

wget url

por user1289749 13.10.2012 / 15:46

3 respostas

Tags wget url

Como salvar o "estado de rolagem" do arquivo PDF no Chrome? Atalho para criar nova equação no Word 2011

score 20 · Answer 1

wget está funcionando bem. A sintaxe do URI especifica que o fragmento - o #foo part - deve ser interpretado inteiramente do lado do cliente e não é usado ao recuperar o próprio documento.

Por exemplo, se for uma página HTML, o navegador pode rolar para baixo até uma seção nomeada ou, no seu caso, acionar um código JavaScript que mostre uma foto específica.

Em outras palavras, no que diz respeito a wget , os URIs

http://www.somesite.com/restaurants.html#photo=22x00085 e
http://www.somesite.com/restaurants.html

... aponta para a mesma página /restaurants.html . Cabe ao seu navegador fazer o resto. Abrir restaurants.html#photo=22x00085 no navegador deve funcionar bem.

score 8 · Answer 2

Sem visitar o link adequado, não sei dizer qual é, mas há apenas duas opções:

O hash realmente faz parte do nome do documento solicitado. Nesse caso, você pode codificá-lo:

http://www.somesite.com/restaurants.html%23photo=22x00085
No outro caso, em circunstâncias normais, link e link deve apontar para a mesma página. A parte depois do hash simplesmente indica a âncora que o navegador deve rolar depois de carregar a página; nem sequer é enviado para o servidor.

No entanto, é possível, que o hash é (ab) usado para carregar uma foto em particular com JavaScript. O Wget não pode interpretar JavaScript, então não há nada que você possa fazer sobre isso.

score 0 · Answer 3

Esse não é o URL da imagem. É o URL de uma página que usa um script ou outro código para buscar a imagem. Tente carregar a página com o JavaScript desativado. Isso é o que o wget está buscando para você.

Para encontrar o URL da imagem, tente visitar a página pelo navegador e, em seguida, clique com o botão direito do mouse na foto. Deve haver uma opção para visualizar informações sobre a imagem, incluindo seu URL.

Se isso não funcionar, pode ser porque a imagem está sendo carregada por meio do Flash ou de algum outro programa do lado do cliente. Você pode usar o Fiddler ou o Wireshark para ver qual URL está carregando.

Se você nos fornecer o URL real do site com a imagem, poderemos ajudar você a determinar como a imagem está sendo carregada.