Como baixar um documento de uma página da Web com o wget

Question

Como baixar um documento de uma página da Web com o wget

#1 resposta do (1 votos)

0

Eu tenho uma página da web que contém um link para um documento. Eu sou capaz de baixar o documento usando o seguinte comando:

wget -r -A.doc www.website.com/1.doc

No entanto, gostaria de fornecer o link para a página que contém o documento e para wget verificar o link do documento e baixá-lo.

Existe uma maneira de usar wget para procurar por um link específico sendo um tipo de documento?

wget download file-types

por mikimr 16.11.2017 / 05:30

1 resposta

Tags wget download file-types

Como executar o “install-build-deps.sh” para o Chromium Building xdg-open abre um arquivo htm especificado, mas ignora o local da tag (#) dentro da página

score 1 · Answer 1

Algo como isso pode funcionar -

wget -r -l 2 -A doc,docx,odt http://example.com/page-to-scan.html

Receba recursivamente a página em link e siga todos os links nessa página e inclua tudo do site próximo nível. E depois jogue fora qualquer coisa que não termine em .doc, .docx ou .odt (você menciona documento, então esses são os 3 tipos - MS antigo, MS atual e Open | Libre Office)