Navegue pelo site arquivado

0

Eu tenho arquivos html / webpage armazenados em uma pasta localmente na minha máquina. Eu posso ver este conteúdo muito bem usando qualquer navegador. No entanto, a longo prazo, eu preferiria ter o conteúdo armazenado dentro de algum tipo de formato de arquivo (ZIP?). Eu poderia fazer isso e extrair manualmente o conteúdo cada vez que eu quiser ver as páginas. No entanto, isso tem várias desvantagens.

Como posso visualizar arquivos html / webpage dentro de um arquivo com as seguintes condições:

  1. Não ter que extrair manualmente o conteúdo de cada vez

  2. O conteúdo não deve ser extraído no mesmo diretório que o arquivo - ele deve ir para outro lugar, como um diretório temporário do sistema

  3. Não ter que extrair TODO o conteúdo apenas para visualizar algumas páginas. Eu gostaria que a solução fosse capaz de extrair apenas o conteúdo necessário para tornar a página atual sendo visualizada

por dtmland 17.03.2014 / 16:58

1 resposta

3

O one-way, que eu posso pensar, para cumprir seus requisitos seria escrever um script que faz isso. Quando você quiser ver uma página do arquivo, abra-a com o script.

Dessa forma, você pode fazer o script fazer o seguinte:

  • crie uma pasta temporária
  • leia o arquivo HTML
  • pegue todos os links necessários
  • passe por eles e pegue o restante dos links, se houver
  • crie a estrutura a partir do arquivo
  • extrai os arquivos necessários (dos links) para a estrutura recém-criada
  • exibir a página
  • remova a pasta temporária ao fechar a página

Eu sei que envolve um pouco de trabalho, mas, dependendo do uso e da necessidade, pode valer a pena.

    
por 17.03.2014 / 17:51