O wget -k ainda converterá links para caminhos relativos se o wget for interrompido prematuramente?

3

Estou executando o wget em um site que (eu percebi) tem dois idiomas - e páginas duplicadas para cada idioma. Eu já tenho o conteúdo em inglês, então eu gostaria de parar de baixar qualquer coisa mais. Eu especifiquei o switch -k quando eu o executei, então ele irá converter os links para links relativos como de costume se eu parar o wget antes de fazer o download completo de tudo? Ou vai simplesmente parar?

(Há outra pergunta na rede do StackExchange que trata de forçar o wget a converter links em conteúdo já baixado executando

wget -nc -k [previous options] [previous url]

mas os timestamps foram acidentalmente desativados, o que não é uma opção.

    
por kathryn 27.06.2012 / 18:12

1 resposta

4

Não.

A opção -k não é aplicada até que o download seja concluído.

Se wget for cancelado (ou seja, ctrl + c), a opção -k não será invocada.

Você pode ver isso quando o wget for concluído, os últimos passos são a conversão dos links.

Ele diz a você no final quantos arquivos .html foram convertidos. Seus timestamps também são atualizados durante este processo.

UPDATE: Tente fazer uso da opção -R para excluir os arquivos que estão em um idioma diferente. Mas isso só funciona se os arquivos tiverem algo que os torne uniformemente únicos.

Tente por exemplo:

-R*_en*.htm*

Isso excluiria arquivos que terminem em .htm ou .html e que tenham o _en em algum lugar no caminho deles. Eu uso um sublinhado ou algo que seria buffer a parte "en" porque eu não quero excluir arquivos que simplesmente contenham um "en".

Mas isso só funciona se a consistência deles estiver na nomenclatura do arquivo.

    
por 27.06.2012 / 18:41

Tags