wget preso no meio do espelhamento de uma página da web

0

Eu estava espelhando um site com o seguinte comando:

wget -m -nc -p -E -k -np -e robots=off https://www.somesite.com/ & disown

E tudo estava indo bem até que vi que estava preso em

Reusing existing connection to www.somesite.com:443.

e eu fechei esse tty.

O que devo fazer para continuar?

Aqui está uma parte da saída do wget:

www.somesite.com/.../sport.html       [   <=>                                           ] 833.32K  1.53MB/s    in 0.5s    
Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:23 (1.53 MB/s) - ‘www.somesite.com/.../sport.html’ saved [853319]

--2018-02-10 16:34:23--  http://www.somesite.com/.../social
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../social.html’

www.somesite.com/.../social.html      [ <=>                                             ] 141.35K   816KB/s    in 0.2s    

Last-modified header missing -- time-stamps turned off.
2018-02-10 16:34:24 (816 KB/s) - ‘www.somesite.com/.../social.html’ saved [144747]

--2018-02-10 16:34:24--  http://www.somesite.com/.../parliament
Reusing existing connection to www.somesite.com:80.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘www.somesite.com/.../parliament.html’

O comando que eu usei é:

wget -m -c -p -E -k -np -e robots=off https://www.somesite.com

Não há como instruir o wget a não baixar o mesmo URL que ele já havia baixado antes?

    
por yukashima huksay 08.02.2018 / 10:18

1 resposta

1

Basta executar o comando novamente. wget é inteligente o suficiente para continuar o download. No entanto, você deve especificar as opções corretas.

Por exemplo, remova a opção -nc se quiser baixar novamente os arquivos alterados (consulte também Pula o download se houver arquivos no wget? ):

% bl0ck_qu0te%

Se o download foi interrompido durante o download de um arquivo grande, talvez você queira adicionar a opção -c :

% bl0ck_qu0te%

Fonte de citações: man wget

Você também deve considerar usar screen ou tmux em vez de disown para poder verificar o status e a saída de seus processos em segundo plano.

    
por Melebius 08.02.2018 / 11:51