Eu li o manual do Wget, mas infelizmente isso não parece resolver o meu problema, então eu ficaria muito grato se alguém pudesse me oferecer um pouco de ajuda.
Temos um site, (digamos) website.com, com links diretos para (digamos) website.com/1/, website.com/2/, ... etc.
Agora, cada página website.com/r/, onde r é um número inteiro, vincula a vários documentos em PDF. Em vez de estarem localizados em website.com/r/doc-i.pdf - o que seria conveniente - todos eles estão localizados em website.com/files/doc-i.pdf.
Assim, quando eu executar o comando wget -r -l 2 -A pdf website.com
, eu terminarei com uma pasta grande chamada "arquivos", com todos os documentos em pdf contidos nela.
Eu preferiria, no entanto, que eles fossem organizados em diferentes pastas chamadas 1, 2, ..., n, que correspondem à página da qual foram baixadas. Como vou baixar no total cerca de 10.000 arquivos pdf, eu prefiro não ter que fazer isso manualmente.
Então, como eu digo ao Wget para organizar os arquivos, não pela estrutura de diretórios do site, mas pela rota em que foram levados para chegar ao arquivo?
Espero que minha explicação seja clara e que isso não seja muito difícil de alcançar.