Sua única pergunta parece ser:
In this case, will I never get my links converted over?
Eu acho que não. Você poderia tentar isso com uma partição limitada em tamanho e ver o que o wget faz quando ficar sem espaço (ou usar a opção --quota
, presumivelmente ele ainda será convertido com isso).
Eu posso entender porque esta é a estratégia. Se isso fosse feito na hora, teríamos que passar por todos os documentos para cada item baixado. Considere:
- O A.html é baixado.
- B.html é baixado, agora verifique A.html para links.
- C.html é baixado, agora verifique A.html e B.html para links.
- ... e assim por diante.
Em vez disso, presumivelmente, um manifesto é mantido e, ao final, todos os documentos são digitalizados uma vez . É claro que meu método on-the-fly poderia ser melhorado mantendo um índice de todos os links, mas ainda acho que ele será de ordens de magnitude mais lenta - e exigirá que as ordens de magnitude sejam gravadas com mais frequência no disco. Em vez de salvar um arquivo, em seguida, alterá-lo uma vez no final, você normalmente estaria reescrevendo dezenas ou centenas de vezes.