Não é possível baixar o conteúdo do site

1

Estou usando o Ubuntu 13.04. Eu abri este site no meu navegador. O site começa a baixar e exibir visualizações de um livro na mesma página.

Gostaria de baixar o livro exibido na página para o disco rígido do meu sistema. Se eu usar wget , ele estará baixando apenas a página, mas não o livro. Aqui está o comando que estou tentando, por favor, verifique se há clareza abrindo o URL no navegador e, em seguida, usando wget .

$ wget http://www.amazon.com/gp/reader/0072520426/ref=sib_dp_ptu#reader-link

Quando você abre por meio de um navegador da Web, o livro começa a ser baixado e exibido na página. Como posso baixar o livro no meu disco rígido? Não há opções na página para fazer o download.

    
por Ravi 21.11.2013 / 17:11

2 respostas

0

O livro é uma sucessão de imagens, como pode ser visto na guia do desenvolvedor (ou ferramentas de desenvolvimento ou página de origem, como quiser chamá-lo) e talvez seja necessário usar o método recursivo para fazer o download de tudo servidor permite isso.

    
por 21.11.2013 / 17:30
0

Eu costumo usar httrack para baixar / espelhar o conteúdo da web de um site.

$ httrack http://2011.example.com -K -w -O . -%v --robots=0 -c1 %e0

Após a execução, você fica com uma estrutura de diretórios local e navegável. Por exemplo:

$ ls -l
total 304
-rw-r--r--  1 saml saml   4243 Aug 17 10:20 backblue.gif
-rw-r--r--  1 saml saml    828 Aug 17 10:20 fade.gif
drwx------  3 saml saml   4096 Aug 17 10:20 hts-cache
-rw-rw-r--  1 saml saml    233 Aug 17 10:20 hts-in_progress.lock
-rw-rw-r--  1 saml saml   1517 Aug 17 10:20 hts-log.txt
-rw-------  1 saml saml 271920 Aug 17 10:22 hts-nohup.out
-rw-r--r--  1 saml saml   5141 Aug 17 10:20 index.html
drwxr-xr-x 10 saml saml   4096 Aug 17 10:21 2011.example.com

Ao fazer o download, você verá o seguinte tipo de saída:

Bytes saved:    21,89KiB           Links scanned:   12/45 (+4)
Time:   2s                         Files written:   4
Transfer rate:  2,65KiB/s (2,65KiB/s)  Files updated:   1
Active connections:     1          Errors:  7

Current job: parsing HTML file (57%)
 request -  2011.example.com/cgi-bin/hostnames.pl   0B /    8,00KiB

Pode ser em segundo plano e / ou abortado e depois retomado. Esta é apenas a ponta do iceberg em termos de recursos. Há também uma GUI para configurar e baixar um download à medida que avança.

Existe uma extensa documentação no httrack website e no googling.

    
por 21.11.2013 / 23:24

Tags