Faça o download de todos os arquivos com algumas strings em seus nomes

1

No link , eu gostaria de baixar todos os arquivos pdf do nome *-2up.pdf , por exemplo, link

Isso pode ser feito usando wget no bash?

Obrigado.

    
por Tim 02.11.2014 / 23:28

1 resposta

2

Para recuperar arquivos recursivamente, mas apenas recuperar aqueles que terminam em 2up.pdf , tente:

wget -r -nd -A 2up.pdf 'http://www.inf.usi.ch/carzaniga/edu/algo08f/schedule.html'

Explicação:

  • -r informa wget para obter arquivos recursivamente

  • -nd informa wget para manter todos os arquivos baixados no diretório atual. Caso contrário, tentaria recriar a estrutura de diretórios em www.inf.usi.ch .

  • -A 2up.pdf restringe os downloads a nomes de arquivos que terminam com 2up.pdf .

Refinamento

Quando solicitado a ser recursivo, wget pesquisará todos os links html procurando links para arquivos que possam ser aceitos. Se sabemos que todos os arquivos que queremos estão vinculados diretamente no URL de origem, não queremos esse comportamento. Para restringir a profundidade na qual wget pesquisará, use a opção --level :

wget -r -nd -A th-2up.pdf -A schedule.html --level=1 'http://www.inf.usi.ch/carzaniga/edu/algo08f/schedule.html'

O também demonstra que várias opções -A podem ser usadas juntas.

    
por 02.11.2014 / 23:39

Tags