wget -r -O - $SITE | scanningProgram
funcionará, desde que você não se importe com nomes de arquivos, nomes de usuário, caminhos etc.
Veja um exemplo
wget -r -O - http://ginatrapani.googlepages.com | sed 's/./X/g'
toda a saída deste site é convertida em X caracteres