Tente coletar métricas e gerar gráficos delas. Nada supera os gráficos. Uma ferramenta como a Munin pode ser muito útil nessas situações, olhar para a memória, io, processos, cpu, redes, interrupções, etc. ao longo do tempo.
Além disso, se sua máquina for uma VM e tiver um sistema de arquivos de rede que se torne indisponível, isso poderá explicar a lacuna nos tempos de registro (para pontos extras, tente logar remotamente).