É possível fazer o download dessas páginas da Web como um livro?

3

Eu gostaria de baixar um tutorial de SQL aqui link , como um livro com todas as seções relacionadas ao SQL.

Aqui está o meu comando

wget -r -np -nH  -p -k  http://www.w3schools.com/sql/default.asp

No diretório sql baixado, recebo alguns arquivos asp, que não sei como abrir no Chrome.

Eu baixei as páginas da web corretamente? Como eu devo fazer? Obrigado!

    
por Tim 13.09.2014 / 17:31

4 respostas

6

Eu usaria uma ferramenta apropriada como httrack e não perderia meu tempo tentando tirar isso de uma ferramenta como wget ou curl . Veja como você pode fazer o download do URL que está perguntando, eu mesmo fiz isso e ele funciona bem no Chrome!

$ httrack http://www.w3schools.com/sql/default.asp
Mirror launched on Sat, 13 Sep 2014 22:50:32 by HTTrack Website Copier/3.48-19 [XR&CO'2014]
mirroring http://www.w3schools.com/sql/default.asp with the wizard help..
Done.57: www.w3schools.com/sql/trysql_view.asp?x= (0 bytes) - OK
Thanks for using HTTrack!

Depois de concluído, fico com a seguinte estrutura de diretórios:

$ ls -l
total 36
-rw-r--r--. 1 slm slm 4243 Sep 13 22:50 backblue.gif
-rw-rw-r--. 1 slm slm  181 Sep 13 22:51 cookies.txt
-rw-r--r--. 1 slm slm  828 Sep 13 22:50 fade.gif
drwx------. 2 slm slm 4096 Sep 13 22:51 hts-cache
-rw-rw-r--. 1 slm slm  736 Sep 13 22:51 hts-log.txt
-rw-r--r--. 1 slm slm 5057 Sep 13 22:50 index.html
drwxr-xr-x. 3 slm slm 4096 Sep 13 22:50 www.w3schools.com

Para verificar as coisas, basta navegar até o arquivo index.html no nível raiz e você será saudado com a seguinte página:

Aoclicarnolink,vocêserádirecionadoparaaspáginastransferidaspordownload:

E apenas por medida, aqui estou clicando em um dos links laterais para demonstrar que ele pode navegar muito bem.

Referências

por 14.09.2014 / 05:01
1

Primeiro você deve copiar seu diretório de trabalho atual para um diretório de teste para execução a seco e tentar isso abaixo.

Você deve então executar:

isso deve converter o arquivo em uma resposta html de uma página asp (obtendo a resposta do servidor web com o comando -O e colocar a página em um arquivo filename.html após buscar)

  wget -O filename.html http://www.w3schools.com/sql/default.asp

substitua os nomes das extensões das páginas

  for f in *.old_file_extention; do mv $f 'basename $f to .new_file_extension; done;

em seguida, substitua as ligações dos arquivos .html das ligações .asp das páginas em todas as páginas .html

  sed -i 's/.asp/.html/' *.html 

tente isso; então você deve ser capaz de abrir suas páginas web com links
 funcionando corretamente. você pode precisar resolver alguma coisa com o primeiro comando porque ele só recebe uma página por vez. Você tem que combinar o que você tem.

    
por 15.09.2014 / 09:41
0

Tente:

wget -r http://www.w3schools.com/sql

Sim, eu tenho resultado

Eu tenho os seguintes diretórios e arquivos:

mohsen@debian:~/offline docs/www.w3schools.com$ ls
about  angular  aspnet  bootstrap  css  default.asp  favicon.ico  forum  html  index.html  jquery  js  php  robots.txt  sitemap  sql  stdtheme.css  xml
    
por 13.09.2014 / 17:45
-2

Esta pode ser uma resposta curta e espero que ajude. Eu iria wget o arquivo .asp e depois renomeá-lo para um arquivo com uma extensão .html. Isso levará a saída .asp html e abrirá o arquivo como .html em um navegador.

    
por 14.09.2014 / 08:45

Tags