Bulk image download

0

Existe um programa / aplicativo para o Ubuntu que permite baixar várias imagens de uma página? Para ser exato, quero tirar algumas fotos do site

link

Algumas das recepções são uma lista interminável de fotos e eu quero juntá-las.

Eu tentei o DownThemAll com o Firefox, mas 1. Eu só consegui as miniaturas e 2. Eu uso o Chrome agora.

    
por Carlos 14.11.2014 / 23:23

1 resposta

3

Apesar de não estar familiarizado com a codificação, isso ainda deve fazer o que você deseja. Claro, você é mais do que bem-vindo a esperar que outro usuário publique uma solução de GUI.

Basta copiar e colar o seguinte código em um documento de texto e salvá-lo como dlimgs.py . Eu recomendo fazer uma nova pasta no seu diretório pessoal chamado bin e salvá-lo lá.

#!/ust/bin/env python

import sys,urllib2,re

def main(url):
    page = getpage(url)
    start = page.find('articlebody')
    page = page[start:]
    lines = page.split('\n')
    for l in lines:
        if ('<img' in l) and ('.jpg' in l):
            matches = re.search(".*<img.*'(.*\.jpg)'.*",l)
            img = matches.group(1)
            name = img[img.rfind('/')+1:]
            print 'Downloading: '+name
            img = getpage(img)
            with open(name,'w') as f:
                f.write(img)

def getpage(url):
    user_agent = 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:31.0) Gecko/20100101 Firefox/31.0'
    headers = {'User-Agent':user_agent}
    req = urllib2.Request(url, None, headers);
    response = urllib2.urlopen(req)
    return response.read()

if __name__ == '__main__':
    main(sys.argv[1])

Em seguida, abra um terminal com Ctrl + Alt + T e faça o seguinte:

  1. Mover para onde você salvou usando o comando cd (Exemplo: cd ~/bin )
  2. Invoque o script com python dlimgs.py <url>

Baixar todas as imagens e salvá-las na pasta ~/bin . Observe que isso foi escrito especificamente para o site que você forneceu na pergunta e, portanto, ignorará as imagens de cabeçalho na parte superior da página. Provavelmente, isso causará erros em outros sites. Mais uma observação, ele sobrescreverá quaisquer imagens com os mesmos nomes de arquivos no ~/bin dir, então tenha cuidado.

    
por TheSchwa 15.11.2014 / 00:24