Outra alternativa é usar o rsyslog e fazer com que ele registre eventos do kernel em outro servidor. Obviamente, isso não ajudará se a pilha de rede for a causa de suas falhas, mas fornecerá a você um registro remoto de todos os outros eventos do kernel.
você pode fazer o log remoto com o sysklogd antigo, mas é mais difícil de configurar e seguro, e só roda sobre o udp. O rsyslog pode fazer logging remoto via udp ou tcp.
Eu usei o rsyslog para configurar o servidor de log central (bom se você tiver muitas caixas para monitorar) e também para configurar pares ou trios de servidores que registram um ao outro com regras como as seguintes em cada:
se $ fromhost-ip == '127.0.0.1' e $ syslogfacility-text == 'kern' então @ otherserver.hostname
PS: na minha experiência, a causa mais provável de falha é RAM insuficiente. ou algum script CGI ou php mal escrito usando toda a RAM disponível, fazendo com que o killer da OOM do kernel fosse postal.