Em um sistema RHEL, você verá um acúmulo de erros na saída do buffer de anel do kernel ( dmesg
), bem como /var/log/messages
. Quando o limite de ECC for excedido, os aplicativos podem simplesmente falhar. O servidor poderia inicializar a quente. Você pode ter um pânico no kernel. O log de exceções de verificação da máquina terá indicadores. Eu até vi casos em que o sistema foi reinicializado e desativa o DIMM ruim.
Se este for o hardware do servidor corporativo, o log de eventos do sistema poderá ser preenchido com erros. O watchdog do servidor pode expirar e forçar uma inicialização a frio do sistema.
Neste ponto, você sabe que tem um problema ... Portanto, a solução certa é substituir o DIMM incorreto. Na maioria dos casos, o modo de falha não é bonito, por isso é melhor evitar a dor. Fica feliz que a RAM ECC lhe deu avisos.