Você pode usar algo como o HTTrack para criar um espelho estático local do site primeiro. Em seguida, cd
no espelho local e grep
nos endereços de e-mail:
grep -srhwoIiE "[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}" . \
| tr '[:upper:]' '[:lower:]' \
| sort -u
Provavelmente existem regexes melhores para emails (é notoriamente difícil, porque o email RFC é muito solto), mas isso deve ajudá-lo.