Existem vários utilitários para baixar sites inteiros. Execute um, siga todos os links para o seu site, mas não para outros sites. Qualquer coisa que não esteja no arquivo resultante pode ser excluída.
Eu tenho um site antigo que estou gerenciando e gostaria de remover todos os arquivos externos não utilizados (.css, .jpg, .js, etc.) que estão atualmente em várias pastas em todo o site.
Existe uma ferramenta que possa me ajudar a identificar e / ou remover essas para mim?
Meu primeiro pensamento é escrever um script que reduz alguns meses de arquivos de log brutos para apenas a parte URI deles, então reúne uma lista de diretórios e, finalmente, percorre a lista de diretórios e lista tudo o que não tem uma aparência correspondente no arquivo de log condensado.
Vários editores, como o Dramweaver e o Expression Web, possuem utilitários integrados para detectar arquivos desvinculados no site. Não conheço nenhuma ferramenta gratuita, mas ficaria surpreso se não houvesse.