Copie um site e preserve a estrutura de arquivos e pastas

Question

Copie um site e preserve a estrutura de arquivos e pastas

#1 resposta do (5 votos)
#2 resposta do (2 votos)

1

Eu tenho um antigo web site rodando em uma versão antiga do Oracle Portal que precisamos converter em uma estrutura flat-html. Devido a danos ao servidor, não podemos acessar a interface administrativa e, mesmo se pudéssemos, não haveria nenhuma funcionalidade de exportação que funcionasse com versões modernas de software.

Seria suficiente rastrear o site e ter todas as páginas & imagens salvas em uma pasta, mas a estrutura do arquivo precisa ser preservada; ou seja, se uma página estiver localizada no link , ela precisará ser salva em / foo / bar / baz / mypage.html para que os vários bits de Javascript continuem a funcionar.

Nenhum dos rastreadores da Web que encontrei conseguiu fazer isso; todos eles querem renomear as páginas (page01.html, page02.html etc) e quebrar a estrutura de pastas.

Existe algum rastreador que recriará a estrutura do site da forma que aparece para um usuário que acessa o site? Não é necessário refazer nenhum conteúdo das páginas; uma vez re-hospedadas, todas as páginas terão os mesmos nomes originais, então os links continuarão a funcionar.

web web-crawler

por DrStalker 11.06.2010 / 08:40

2 respostas

2

Experimente a Copiadora de sites do HTTrack: link

(desculpe por não ter mais detalhes, tarde demais / de manhã cedo)

por 11.06.2010 / 08:43

Tags web web-crawler

Melhor maneira de verificar se uma máquina está na rede corporativa Exigir que o .Net funcione como uma barreira para a adoção de nosso software em um ambiente corporativo?

score 5 · Accepted Answer

wget -r recursivamente obtém um site inteiro e salva tudo localmente na mesma estrutura.