O problema é resolvido na página link dos bugs do wget GNU. Parece que o problema foi corrigido na nova versão alfa 1.19.
Ao executar
wget -r -k -l 1 "http://econ.ucsb.edu/~tedb/Courses/GraduateTheoryUCSB/TheoryF16.html"'
o processo é concluído com êxito, mas alguns arquivos não são baixados e vários links absolutos não são convertidos.
Por exemplo, o arquivo BlumeSimonCh21.pdf é vinculado duas vezes ao código-fonte em HTML, um como relativo e outro como caminho absoluto, ambos pertencentes ao mesmo host. O último link para o site real através da Internet, em vez de ligar para o arquivo local. Além disso, o arquivo Bernoulli.pdf não é baixado por wget
apesar de estar no mesmo diretório do host. Eu tentei adicionar -H
ao comando wget
, esses problemas ainda ocorrem. É um bug?
Alguns outros thoguhts: O manual diz quando -r
é especificado, wget
downloads simplesmente sobrescreve o arquivo antigo com o novo se eles forem o mesmo arquivo. Talvez isso tenha a ver com baixar novamente os arquivos?
EDIT: Estou executando o mais novo release wget
até hoje, 1.18 no Arch Linux.
O problema é resolvido na página link dos bugs do wget GNU. Parece que o problema foi corrigido na nova versão alfa 1.19.
Tags wget