wget faz o download de todas as páginas da web de um sitemap XML

1

Estou tentando espelhar e baixar como arquivos HTML estáticos todos os links em um arquivo de sitemap XML.

Encontrei o seguinte comando que supostamente realiza o que estou tentando alcançar, mas na verdade não faz download de nada:

wget --quiet http://www.mydemosite.com/sitemap.xml --output-document - | egrep -o "https?://[^<]+" | wget -i -

Eu encontrei este tópico aqui:

link

Então, minha pergunta é: como posso espelhar e baixar como arquivos HTML estáticos todos os links em um arquivo de sitemap XML usando wget?

Obrigado

    
por user2028856 16.02.2015 / 10:36

0 respostas