wget não está baixando arquivos recursivamente


Eu vi algumas das postagens deste site sobre como baixar arquivos de um diretório de forma recursiva. Então, eu executei a seguinte linha:

wget -r -nH --cut-dirs=3 -A '*.bz2' -np http://www.xfce.org/archive/xfce-4.6.2/src/

Faz o download apenas da página de índice e a exclui automaticamente.


--2016-07-01 16:56:02--  http://www.xfce.org/archive/xfce-4.6.2/src/
Resolving www.xfce.org (www.xfce.org)...
Connecting to www.xfce.org (www.xfce.org)||:80... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: http://archive.xfce.org/xfce/4.6.2/src/ [following]
--2016-07-01 16:56:17--  http://archive.xfce.org/xfce/4.6.2/src/
Resolving archive.xfce.org (archive.xfce.org)...
Connecting to archive.xfce.org (archive.xfce.org)||:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘index.html’

index.html                                [ <=>                                                                      ]   8.05K  --.-KB/s   in 0.03s  

2016-07-01 16:56:23 (247 KB/s) - ‘index.html’ saved [8239]

Removing index.html since it should be rejected.

FINISHED --2016-07-01 16:56:23--
Total wall clock time: 21s
Downloaded: 1 files, 8.0K in 0.03s (247 KB/s)

O diretório web contém muitos arquivos tar.bz2 . Alguém pode me dizer onde estou errado?

Minha versão do wget é 1.16.3

por Abhimanyu Saharan 01.07.2016 / 13:31

1 resposta


Parece que não é trivial obter listagem de diretórios em http; Eu poderia obter os arquivos bz2 usando abaixo:

wget -k -l 0 "http://archive.xfce.org/xfce/4.6.2/src/" -O index.html ; cat index.html | grep -o 'http://archive.xfce.org/xfce/4.6.2/src/[^"]*.bz2' | uniq -c | xargs wget

Espero que esta ajuda.

por 01.07.2016 / 14:34