Como baixar um documento de uma página da Web com o wget

0

Eu tenho uma página da web que contém um link para um documento. Eu sou capaz de baixar o documento usando o seguinte comando:

wget -r -A.doc www.website.com/1.doc

No entanto, gostaria de fornecer o link para a página que contém o documento e para wget verificar o link do documento e baixá-lo.

Existe uma maneira de usar wget para procurar por um link específico sendo um tipo de documento?

    
por mikimr 16.11.2017 / 06:30

1 resposta

1

Algo como isso pode funcionar -

wget -r -l 2 -A doc,docx,odt http://example.com/page-to-scan.html

Receba recursivamente a página em link e siga todos os links nessa página e inclua tudo do site próximo nível. E depois jogue fora qualquer coisa que não termine em .doc, .docx ou .odt (você menciona documento, então esses são os 3 tipos - MS antigo, MS atual e Open | Libre Office)

    
por 16.11.2017 / 13:16