Estou enfrentando uma situação estranha com nossos servidores de e-mail de retransmissão que enviam e-mails em nome de nossos clientes.
Nossa infra atual é composta de 2 servidores de retransmissão de email configurados com o Postfix que recebem todos os e-mails de nossos aplicativos internos e estão encarregados de enviá-los para a Internet.
Agora, o problema que estamos vendo é que cerca de 20% de todos os e-mails recebidos por essas retransmissões não são enviados e desaparecem na fila ativa.
Aqui está um exemplo de log de postfix mostrando um email que não sai da fila ativa:
Feb 10 17:12:02 relay02 postfix/smtpd[31701]: EFF07209F6A3: client=coreapps02[10.11.12.202]
Feb 10 17:12:02 relay02 postfix/cleanup[10949]: EFF07209F6A3: message-id=<[email protected]>
Feb 10 17:12:02 relay02 postfix/qmgr[23160]: EFF07209F6A3: from=<[email protected]>, size=3581, nrcpt=1 (queue active)
Esta mensagem e parece perdida, pois não está presente no diretório /var/spool/postfix/active
.
Eis um exemplo de email que é enviado para a Internet mais ou menos ao mesmo tempo:
Feb 10 17:12:02 relay02 postfix/smtpd[31701]: D8F67209F6AF: client=coreapps02[10.11.12.202]
Feb 10 17:12:02 relay02 postfix/cleanup[10949]: D8F67209F6AF: message-id=<[email protected]>
Feb 10 17:12:02 relay02 postfix/qmgr[23160]: D8F67209F6AF: from=<[email protected]>, size=3617, nrcpt=1 (queue active)
Feb 10 17:12:03 relay02 postfix/smtp[10738]: D8F67209F6AF: to=<[email protected]>, relay=cluster1.us.messagelabs.com[216.82.241.131]:25, conn_use=2, delay=0.18, delays=0/0/0.02/0.16, dsn=2.0.0, status=sent (250 ok 1486746723 qp 65173 server-8.tower-54.messagelabs.com!1486746722!118816510!2)
Feb 10 17:12:03 relay02 postfix/qmgr[23160]: D8F67209F6AF: removed
Alguma idéia de porque o Postfix está soltando algumas (~ 20%) das nossas mensagens?