Eu sei que são algumas ferramentas para baixar imagens em massa de páginas da Web, mas preciso fazer algo um pouco diferente.
Estou criando um site que faz a curadoria de imagens encontradas na Web.
Então, em vez de apenas baixar imagens, eu também preciso ter um arquivo salvo com todos os URLs das páginas onde a imagem original pode ser encontrada, para que eu possa vincular aos recursos originais.
Existe essa ferramenta cujo nome eu esqueci que faz quase isso, embora salve o caminho do servidor da imagem, o que é inadequado porque na maioria das vezes, as imagens são hospedadas em um CDN, e eu preciso ser capaz de link para a página original, não hotlinking seu CDN.
Vocês conhecem um método para fazer isso?