Tivemos um problema semelhante em que um serviço verificado via NRPE em um contêiner retornou um WARNING
esperado e, depois de alguns minutos, o mesmo serviço retornou CRITICAL
com o erro 141 / SIGPIPE. Na próxima verificação, ele retornou WARNING
, depois CRITICAL
, depois WARNING
e assim por diante.
Eu realizei uma captura de tráfego para o erro e descobri a questão # 305 do Nagios para descrever com precisão Eu tinha observado. Parece ser causado por uma conexão impura perto do lado do servidor NRPE ao usar SSL ( SSL_shutdown()
) que faz com que ele envie um TCP RST para o cliente que causa uma leitura abortada e, portanto, o SIGPIPE.
A aplicação do patch nrpe-ssl_shutdown-2.patch
anexado ao relatório de problemas para a fonte NRPE, a reconstrução e a reinstalação / reinicialização pareciam impedir que o problema se repetisse, e os avisos agora são relatados normalmente sem erros críticos.