wget não faz download de imagens de um site?

2

Estou tentando baixar tópicos de um fórum da web que contém muitas imagens com o wget. Essas imagens são hospedadas em um domínio separado, então usei o sinalizador -H para permitir o download delas. A ordem completa que estou usando é:

wget -p -H -erobots=off https://example.com/

E quando eu uso quase todos os downloads, exceto as imagens principais. Este é um exemplo de um desses tópicos que estou tentando download .

O que estou fazendo de errado?

    
por Rick 06.07.2018 / 17:13

1 resposta

1

Este é um problema específico do site. Correndo

 wget -H -p -r --user-agent="Mozilla/5.0" -nd --accept jpg,png https://suzuki88.mforos.com/194412/11461305-brico-con-mi-nuevo-suzuki-en-proceso-de-transformacion-muchas-fotos/

me fornece uma lista de arquivos robot.txt. * com conteúdo:

User-agent: *
Disallow:

que basicamente significa que o site acha que você é um robô tentando se adaptar a alguma vulnerabilidade de segurança do site. E a regra é negar acesso a * (todos) robôs a qualquer parte do site afaiu.

    
por 06.07.2018 / 19:46