Você tem monitoramento para seu servidor?
Na verdade, minha resposta para isso seria: Por favor, adicione monitoramento para o seu servidor, se você não tiver. Você deve ter pelo menos: cpu load, cpu temp, uso de disco, temp de disco, IO de disco, tráfego de NIC.
Basta escolher um que você possa instalar e manter facilmente. Qualquer ou uma combinação destes funcionaria (não uma lista completa): mrtg, cacti, zenoss, nagios etc .; com plugins apropriados, scripts snmp ou rrd.
Verifique as paradas em busca de pistas depois que um acidente acontecer.