Perguntas sobre 'httrack'

HTTrack permite que você baixe um site da Internet para um diretório local, criando recursivamente todos os diretórios e obtendo HTML, imagens e outros arquivos do servidor para o seu computador.
0
respostas

httrack website espelho links quebrados

Se eu tiver um website que use <div data-url="/foo/bar/"> <div data1="foo" data2="bar"></div> </div> como links versus o típico <a href="/foo/bar/"> Como posso conseguir que o httrack reconheça iss...
09.09.2013 / 06:37
1
resposta

algo melhor que o httrack para baixar arquivos?

Estou tentando fazer download de documentos (pdf, tiff, imagens) de páginas da Web que possuem javascript e quadros neles. exemplo: link 'httrack --get-files' não baixou nenhum, existem outras maneiras de pensar? outro programa? terei que e...
03.08.2010 / 21:04
1
resposta

É possível esperar que o httrack espere N segundos entre cada transferência?

Limitei as conexões simultâneas, e notei que há algo chamado --advanced-wait, mas o manual não descreve se isso pode fazer o que eu quero fazer. O site em questão que desejo baixar tem um limite de carregamentos de página dentro de um determi...
27.03.2010 / 20:06
1
resposta

Espelhamento stackexchange incluindo imagens externas

Este script criará uma pasta espelho com todas as minhas páginas de atividades salvas para leitura off-line, incluindo todas as perguntas afetadas #!/bin/bash USERNAME=rubo77 MAXDEPTH=2 # increase this if you want to backup more of your histo...
07.11.2014 / 10:15
1
resposta

Como eu uso wget ou CURL em php para capturar um instantâneo de uma página da web com um asterisco * em sua URL? (Pergunta de Wayback Machine archive.org)

A seguinte página da Web na Wayback Machine (archive.org) tem um asterisco * em seu URL: link * / link Nem o CURL nem o wget permitirão que eu pegue a página. Eu estou usando a versão mais recente do Linux Mint (2018). Como faço para u...
05.02.2018 / 21:39
0
respostas

Ignora uma variável GET de links, ao baixar um site para offline

Simplesmente o site que estou baixando tem todos os links que terminam com &sid=335345346fdsfdsfs . Isso continua mudando e cria um monte do mesmo index.html e o mesmo para muitas outras páginas. Eu me pergunto se alguém já lidou com...
09.08.2017 / 10:51
0
respostas

Httraqt download

Estou tentando baixar uma programação de meses em um site. link . * como posso obter o httraqt para baixar todos os dias de setembro? Por exemplo link link link     
19.09.2018 / 12:46