Para recuperar arquivos recursivamente, mas apenas recuperar aqueles que terminam em 2up.pdf
, tente:
wget -r -nd -A 2up.pdf 'http://www.inf.usi.ch/carzaniga/edu/algo08f/schedule.html'
Explicação:
-
-r
informawget
para obter arquivos recursivamente -
-nd
informawget
para manter todos os arquivos baixados no diretório atual. Caso contrário, tentaria recriar a estrutura de diretórios emwww.inf.usi.ch
. -
-A 2up.pdf
restringe os downloads a nomes de arquivos que terminam com2up.pdf
.
Refinamento
Quando solicitado a ser recursivo, wget
pesquisará todos os links html procurando links para arquivos que possam ser aceitos. Se sabemos que todos os arquivos que queremos estão vinculados diretamente no URL de origem, não queremos esse comportamento. Para restringir a profundidade na qual wget
pesquisará, use a opção --level
:
wget -r -nd -A th-2up.pdf -A schedule.html --level=1 'http://www.inf.usi.ch/carzaniga/edu/algo08f/schedule.html'
O também demonstra que várias opções -A
podem ser usadas juntas.