Como fazer backup do blog em exibição no posterous.com

4

Eu gostaria de fazer backup do conteúdo do meu blog que é ativado pelo posterous.com. Gostaria de salvar todos os textos e imagens no disco local. A capacidade de navegar off-line é uma vantagem.

O que eu já tentei:

wget

wget -mk http://myblogurl

Faz o download da primeira página com a lista de postagens e, em seguida, para com a mensagem " 20 redirections exceeded ".

WinHttpTrack

Faz o download da primeira página com redirecionamento para a página inicial do www.posterous.com em vez do conteúdo real da página.

Edit: A URL do site que estou tentando fazer backup é blog.safabyte.net

    
por Martin Vobr 22.01.2010 / 19:25

3 respostas

1

O Posterous.com mantém uma API que pode ajudar você. Em particular, sua API link pode ser útil. Você pode usá-lo para obter um arquivo XML contendo todas as suas postagens e seu conteúdo.

Por exemplo, o link recupera todas as 12 postagens que eu fiz no Posterous.

    
por 26.01.2010 / 05:41
1

Isso funcionou para mim:

wget -r -l inf -k -E -p -nc http://blog.safabyte.net/

Parece que usar -m ativa -N (timestamping) e posterous não está enviando cabeçalhos modificados pela última vez que incomodam o wget, então usei -r -l inf diretamente.

As opções usadas são:

-r recursivo
-l inf profundidade infinita
-k sufixo arquivos html com .html
-E atualiza os arquivos salvos com links para arquivos locais
-p página de download recursos de -nc não fazem o download de URLs mais de uma vez

Este comando ainda não está baixando recursos de outros domínios, o que significa que ele não busca as imagens como elas estão hospedadas em um CDN diferente.

    
por 27.12.2010 / 16:13
0

Gerenciado para baixar pelo menos todo o conteúdo html. O código a seguir parece baixar todas as páginas do blog (usando o Wget 1.11.3 no Windows XP):

wget -mk http://blog.safabyte.net/*

As imagens das postagens ainda não foram baixadas. Parece que é provavelmente porque estão armazenados nos diferentes domínios.

O conteúdo em HTML está em blog.safabyte.com/*, enquanto as imagens estão em link * e files.posterous.com

    
por 24.01.2010 / 22:33