Eu sugeriria que, nesse caso, você terá que tornar todos os seus gatilhos menos sensíveis, e possivelmente exigir mais problemas em sequência, se quiser, antes de acionar um alerta.
Quanto a outros softwares de monitoramento, essa é uma ótima questão para debate e discussão. Eu usei com sucesso a combinação nagios / pnp4nagios com muito sucesso para um site de cerca de 500 sistemas. Bom, é grátis e você pode encontrar pacotes para as principais distribuições do Linux, bem como uma grande quantidade de plug-ins para muitas situações contribuídas pelos usuários do nagios.