wget download usando lista de URLs

4

Estou tentando baixar vários arquivos com wget . As URLs relevantes são armazenadas no arquivo url.txt . Ao usar o comando wget --content-disposition -i url.txt , ele não encontra o arquivo .txt.

Onde devo armazenar o arquivo url.txt?

    
por Chris 27.08.2014 / 10:56

2 respostas

5

Você deve fornecer seus URLs com http://

Seu url.txt deve ter

  http://www.google.com
  http://www.yahoo.com

Se você não tiver o protocolo incluído, receberá mensagens informando o seguinte:

$ wget --content-disposition  -i url.txt 
url.txt: Invalid URL www.google.com: Scheme missing
url.txt: Invalid URL www.yahoo.com: Scheme missing
    
por 27.08.2014 / 11:03
0

Por favor, certifique-se que o arquivo deve estar no formato .html contendo URL, por favor consulte wget man page. -i arquivo --input-file = file Leia as URLs do arquivo, caso em que nenhuma URL precisará estar na linha de comando. Se houver URLs na linha de comando e em um arquivo de entrada, aquelas nas linhas de comando serão as primeiras a serem recuperadas. O arquivo não precisa ser um documento HTML (mas nenhum dano se for) --- é suficiente se as URLs forem listadas apenas sequencialmente. No entanto, se você especificar --force-html, o documento será considerado como html. Nesse caso, você pode ter problemas com links relativos, o que você pode resolver adicionando "" aos documentos ou especificando --base = url na linha de comando.

Obrigado

    
por 27.08.2014 / 13:45

Tags