usando o wget para baixar todos os arquivos de áudio (mais de 100.000 páginas na wikia)

3

Estou tentando baixar todos os arquivos de áudio no Wookiepedia, o wiki do Star Wars.

Meu primeiro pensamento é algo assim

wget -r -A  -nd .mp3 .ogg http://starwars.wikia.com/wiki/

Isso deve fazer o download de todos os arquivos .mp3 e .ogg do wiki, evitando a criação de um diretório. No entanto, quando eu executo este terminal, fico:

bash: http://starwars.wikia.com/wiki/: No such file or directory

O problema é que não posso usar loops porque os URLs são exclusivos para cada página da wiki. Por exemplo:

http://starwars.wikia.com/wiki/Retcon

http://starwars.wikia.com/wiki/C-3PX

http://starwars.wikia.com/wiki/Star_Wars_Legends

É possível fazer o download de URLs nessa estrutura?

EDIT: Esta é a mensagem que recebo usando a resposta.

--2016-02-10 16:21:26-- http://starwars.wikia.com/wiki/ Resolving starwars.wikia.com (starwars.wikia.com)... 23.235.33.194, 23.235.37.194, 104.156.81.194, ... Connecting to starwars.wikia.com (starwars.wikia.com)|23.235.33.194|:80... connected. HTTP request sent, awaiting response... 301 Moved Permanently Location: http://starwars.wikia.com/wiki/Main_Page [following] --2016-02-10 16:21:26-- http://starwars.wikia.com/wiki/Main_Page Reusing existing connection to starwars.wikia.com:80. HTTP request sent, awaiting response... 200 OK Length: 569628 (556K) [text/html] Saving to: ‘index.html’

100%[========================>] 569,628 217KB/s in 2.6s

2016-02-10 16:21:29 (217 KB/s) - ‘index.html’ saved [569628/569628]

Removing index.html since it should be rejected.

FINISHED --2016-02-10 16:21:29-- Total wall clock time: 2.7s Downloaded: 1 files, 556K in 2.6s (217 KB/s)

sl

não me dá nada, não há arquivos no diretório de trabalho.

    
por Thomas Shera 06.02.2016 / 18:40

1 resposta

2

Eu acho que você simplesmente tem a sintaxe um pouco errada. Experimente

wget -r -nd -A=mp3,ogg http://starwars.wikia.com/wiki/
    
por 10.02.2016 / 17:05

Tags