Eu tenho 3 servidores dedicados no hetzner.de, e ocasionalmente recebo alertas de indisponibilidade para esses servidores, de dois sistemas de monitoramento independentes (New Relic e Pingdom) normalmente para todos os três servidores ao mesmo tempo.
Tais alertas excedem 5 min e acontecem em média uma vez em duas semanas. Além disso, na maioria dos casos, durante os “downtimes” relatados, posso acessar meus servidores a partir de casa, mas não posso acessar de outro servidor em local diferente - portanto, algumas solicitações estão chegando e outras não, então provavelmente os servidores não estão disponíveis apenas alguns locais (onde estão os "pingers").
O suporte da Hetzner afirma repetidamente que eles não têm problemas de rede no momento desses alertas e que nenhum outro cliente está reclamando sobre esses problemas. Isso não faz sentido, especialmente porque os alertas são gerados simultaneamente para todos os três servidores, cada um com sua configuração e software diferentes instalados.
Não acredito que seja um bug de monitoramento, porque estou usando dois sistemas de monitoramento diferentes. Além disso, tenho servidores com configurações de software semelhantes em outros data centers (não Hetzner), que não recebem alertas de indisponibilidade desses mesmos sistemas de monitoramento.
Alguém tem uma ideia do que pode estar causando isso e / ou como posso investigar mais a causa para encontrar uma solução?
Tags networking monitoring hetzner