Recursivamente salvar páginas da web

3

É possível salvar recursivamente todas as páginas da web que dependem de uma determinada página? Ou eu sempre preciso salvá-los um por um?

    
por wantSTUDY 12.07.2010 / 16:33

4 respostas

3

Quando precisei disso, descobri que HTTrack é eficaz, fácil de usar e bastante abrangente sobre as opções.

HTTrack is a free (GPL, libre/free software) and easy-to-use offline browser utility.

It allows you to download a World Wide Web site from the Internet to a local directory, building recursively all directories, getting HTML, images, and other files from the server to your computer. HTTrack arranges the original site's relative link-structure. Simply open a page of the "mirrored" website in your browser, and you can browse the site from link to link, as if you were viewing it online. HTTrack can also update an existing mirrored site, and resume interrupted downloads. HTTrack is fully configurable, and has an integrated help system.

WinHTTrack is the Windows 2000/XP/Vista/Seven release of HTTrack, and WebHTTrack the Linux/Unix/BSD release.

    
por 12.07.2010 / 17:57
8
wget -m http://www.example.com/

Mais informações podem ser encontradas com man wget :

-m --mirror Turn on options suitable for mirroring.
            This option turns on recursion and time-stamping,
            sets infinite recursion depth and keeps FTP directory listings.
            It is currently equivalent to -r -N -l inf --no-remove-listing. 
    
por 12.07.2010 / 16:37
1

É possível usar um software que possa rastrear a página. Eu gosto de usar a aranha HTML do Free Download Manager que pode baixar uma página e você pode especificar quantos níveis de profundidade você quer que ela vá.

    
por 12.07.2010 / 16:39
0

Sim É possível usar algumas ferramentas projetadas para essa puposta como: Internet Download Manager (IDM) e o Offline Explorer. Com essas ferramentas, você pode até baixar o site inteiro para explorar offline ou apenas fazer o download de uma página com links dependentes.

    
por 12.07.2010 / 17:19

Tags