Usando o Wget para baixar imagens individuais de um site usando a URL img src onde img class = “decoded”

0

Eu quero tirar imagens isoladas de um site. O site tem fotos. Clicar nas fotos leva a outra página. Eu quero pegar as fotos da tag img src no html. Eu já tenho código unix para extrair as linhas img src que eu quero.

Exemplo: img src="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"

QuandousoowgetparabaixaresseURL,receboumarquivonulo.

QuandoeuinsiromanualmenteesseURLnomeunavegador,aimagemécarregadanomeiodatela.Quandocliconaspropriedades,éumarquivoJPEG.Quandoeuolhoparaafontehtmldapágina,elamostraoseguinte:

<html><head>…</head><body><imgclass="decoded" src="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"alt="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"></img></body></html>

A única coisa que posso imaginar é que isso tem a ver com a tag:

<img class="decoded"

Alguma idéia?

    
por Mike 20.07.2013 / 04:02

1 resposta

0

Eu percebi isso. Como o site é php, precisei adicionar - trust-server-names como um argumento para o wget. Quando fiz isso, pude fazer o download da imagem sem problemas.

    
por 20.07.2013 / 12:11