Eu tenho um servidor de e-mail totalmente funcional em execução no Exim sobre o Debian. Recentemente me perguntaram se era possível obter um registro mensal dos cabeçalhos de todos os e-mails enviados e recebidos. Por cabeçalhos, quero dizer os endereços de e-mail que estão nos cabeçalhos to
, from
, cc
, bcc
.
A ideia é gerar um log que contenha todos os emails nesses cabeçalhos sem distinguir de send / received wtv, assim:
[email protected]
[email protected]
[email protected]
Então, uma linha de e-mail. Então eu decidi tentar grep
e bolar isso:
grep -E -o "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b" exim_mainlog.txt > emails.txt
Ele produz todos os e-mails desse arquivo, mas eu recebo um monte de lixo, como ids de e-mail: [email protected]
e tentativas de spammers para entregar e-mails a contas inexistentes no servidor.
Qual é a melhor maneira (e como posso fazê-lo) para obter a lista limpa, basicamente um e-mail para ser válido, seria necessário verificar as seguintes regras:
cc
ou bcc
) para outro lugar e foi entregue
corretamente; Isso pode ser feito analisando os logs do servidor? Ou talvez um filtro no servidor de email? De qualquer maneira, como?
Obrigado!