Wget com URL que contém #

11

Estou tentando fazer o download de um URL que é como http://www.somesite.com/restaurants.html#photo=22x00085 .

Eu coloco entre aspas simples, mas ele só baixa o link que não é a página correta.

Existe uma solução?

    
por user1289749 13.10.2012 / 17:46

3 respostas

20

wget está funcionando bem. A sintaxe do URI especifica que o fragmento - o #foo part - deve ser interpretado inteiramente do lado do cliente e não é usado ao recuperar o próprio documento.

Por exemplo, se for uma página HTML, o navegador pode rolar para baixo até uma seção nomeada ou, no seu caso, acionar um código JavaScript que mostre uma foto específica.

Em outras palavras, no que diz respeito a wget , os URIs

  • http://www.somesite.com/restaurants.html#photo=22x00085 e
  • http://www.somesite.com/restaurants.html

... aponta para a mesma página /restaurants.html . Cabe ao seu navegador fazer o resto. Abrir restaurants.html#photo=22x00085 no navegador deve funcionar bem.

    
por 13.10.2012 / 19:27
8

Sem visitar o link adequado, não sei dizer qual é, mas há apenas duas opções:

  • O hash realmente faz parte do nome do documento solicitado. Nesse caso, você pode codificá-lo:

    http://www.somesite.com/restaurants.html%23photo=22x00085

  • No outro caso, em circunstâncias normais, link e link deve apontar para a mesma página. A parte depois do hash simplesmente indica a âncora que o navegador deve rolar depois de carregar a página; nem sequer é enviado para o servidor.

    No entanto, é possível, que o hash é (ab) usado para carregar uma foto em particular com JavaScript. O Wget não pode interpretar JavaScript, então não há nada que você possa fazer sobre isso.

por 13.10.2012 / 19:31
0

Esse não é o URL da imagem. É o URL de uma página que usa um script ou outro código para buscar a imagem. Tente carregar a página com o JavaScript desativado. Isso é o que o wget está buscando para você.

Para encontrar o URL da imagem, tente visitar a página pelo navegador e, em seguida, clique com o botão direito do mouse na foto. Deve haver uma opção para visualizar informações sobre a imagem, incluindo seu URL.

Se isso não funcionar, pode ser porque a imagem está sendo carregada por meio do Flash ou de algum outro programa do lado do cliente. Você pode usar o Fiddler ou o Wireshark para ver qual URL está carregando.

Se você nos fornecer o URL real do site com a imagem, poderemos ajudar você a determinar como a imagem está sendo carregada.

    
por 17.10.2012 / 17:03

Tags