Como encontrar todas as ocorrências de um endereço de e-mail em um site

1

Digamos que eu tenha um site grande, que pode ter vários endereços de e-mail que são pegos por spammers. Eu pretendo ofuscar ou remover todos eles.

Qual é a maneira mais fácil de rastrear meu site para encontrar algum endereço de e-mail que eu possa estar expondo?

Por meio de texto na página (que o Google pode pegar, mas não muito bem) ou links mailto: (que o Google não pode).

    
por thomasrutter 03.06.2010 / 06:39

1 resposta

2

Algo como:

wget --mirror --html-extension http://www.mydomain.org/ -o /home/user/temp_site/

então

grep -Hinr "@mydomain.org" /home/user/temp_site/ > /home/user/list_of_pages_with_email

Devolve uma lista de todas as páginas (com números de linha) que contêm os endereços de email dos seus domínios.

Pode precisar de ajustes.

Manuais para wget e grep

    
por 03.06.2010 / 07:05

Tags