Fazer o download de todas as páginas sub html da página pai que é 404 não encontradas?

0

Olá, estou aprendendo o CS50 e gostaria de baixar todos os conjuntos de problemas off-line. Cada problema aparece como uma única página HTML como

http://docs.cs50.net/problems/recover/recover.html
http://docs.cs50.net/problems/fifteen/fifteen.html

enquanto a página principal

http://docs.cs50.net/problems/

retorna um erro 404 .

Como posso baixar todas as páginas sub html? Eu tentei wget e httrack , mas falhei. Obrigado!

    
por mzoz 07.08.2017 / 18:58

1 resposta

0

Infelizmente, você não pode receber as informações fornecidas.

http://docs.cs50.net/problems/ não é uma página da web, é um URL para uma pasta, que não tem uma página da Web padrão dentro dela, normalmente index.html ou default.html . Portanto, o servidor da Web não tem nada para exibir e fornece o erro 404. Além disso, a navegação no diretório é desativada no servidor da Web, pois você não vê as subpastas recover , fifteen , etc. Você pode testar isso ao tentar o link  e obtendo o mesmo erro 404.

A menos que exista uma página da Web que faça referência a todos os subtópicos como links, WGET ou qualquer outro programa semelhante não poderá encontrar as páginas da web. No entanto, é provável que haja um, ou de que outra forma você sabe que essas páginas existem? Se você encontrar essa página, você seria bom para ir, como você e siga os links.

    
por 07.08.2017 / 19:17

Tags