Você pode usar M / Monit para fazer isso.
Meu servidor apache está frequentemente gerando muitos filhos. Acho que há várias causas e, enquanto as separo, auxiliei a situação, obtendo acompanhamento para reiniciar os serviços quando o problema é encontrado.
Uma coisa que ajudaria é um registro histórico das médias de carga. Eu considerei executar um cron job, mas isso parece bobo quando o monit já está fazendo isso. Existe alguma maneira de fazer um registro completo de tudo que ele sabe sobre o estado do sistema? Não apenas para esta situação, mas para outros problemas que tive no passado: espaço em disco, status do servidor, etc.
Olhando para a documentação do monit, ele possui um arquivo de log e possui um serviço da web. Mas não consigo encontrar uma opção de configuração para ativar o log histórico detalhado.