Você pode espelhar um site usando wget
, mas também pode dizer que ele age como um web-spider, por isso não baixará nada.
Então você pode fazer isso, mas lembre-se de salvar o log:
wget --no-directories --mirror --spider "$url" 2>&1 | tee "$log"
No meu caso, no log eu encontrei algo assim:
Spider mode enabled. Check if remote file exists.
--2017-12-19 07:19:23-- URL
Então usei grep
para recuperar as URLs:
grep -P -o -e '(?<=^--....-..-.. ..:..:..-- )(.*)' "$log"
Exemplo:
$ wget --no-directories --mirror --spider https://utw.me/file/scripts/ 2>&1 | tee log.txt
...
$ grep -P -o -e '(?<=^--....-..-.. ..:..:..-- )(.*)' log.txt
...
https://utw.me/file/scripts/Fate%20Zero/%5BUTW%5D%20Fate%20Zero%20-%2001.ass
https://utw.me/file/scripts/Fate%20Zero/%5BUTW%5D%20Fate%20Zero%20-%2002.ass
https://utw.me/file/scripts/Fate%20Zero/%5BUTW%5D%20Fate%20Zero%20-%2003.ass
https://utw.me/file/scripts/Fate%20Zero/%5BUTW%5D%20Fate%20Zero%20-%2004.ass
https://utw.me/file/scripts/Fate%20Zero/%5BUTW%5D%20Fate%20Zero%20-%2005.ass
...