Códigos de Erro MCE / Tela Rosa - Eles devem ser motivo de preocupação?

5

Então eu comprei recentemente um sistema de grau de servidor junto com todos os periféricos de classe de servidor. Sou licenciado para o ESXi 6 e tenho todos os patches recentes instalados. O sistema está funcionando há duas semanas e, de repente, tive uma pane completa.

Eu interpretei este código de erro como "Internal Timer Error". Encaminhei a informação para o SuperMicro, mas para ser honesto, não estou muito confiante com as respostas deles até agora. Minha interpretação foi que o sistema simplesmente não deveria travar - porque é um Xeon com memória ECC rodando o ESXi.

É possível que isso tenha ocorrido com algum erro e não deva acontecer novamente? Como você lidaria com isto? Procurando por alguns conselhos daqueles que viram esses tipos de erros e o que acabam fazendo.

    
por davewolfs 03.10.2015 / 00:07

2 respostas

2

Você vê esse erro (MCE, exceção de checagem de máquina) precisamente porque ele tem RAM ECC.

Você tem algum hardware quebrado em algum lugar, provavelmente um memory stick, mas possivelmente um ou mais processadores (CPU 10 talvez?) Ou algo entre. Invoque seu contrato de suporte.

Também podem ser outros bits do hardware, mas toda vez que vi isso, a RAM ECC defeituosa sofreu falhas de múltiplos bits. Se o MCE decodificado como "erro interno do timer", a próxima coisa mais provável é uma CPU ou placa-mãe defeituosa.

    
por 03.10.2015 / 00:19
3

Sim, é motivo de preocupação. O servidor caiu!

Verifique sua RAM e os pinos do soquete da CPU (se você montou manualmente o servidor).

Isso é sobre todas as informações que você terá. Você pode abrir um caso de suporte com o VMware e eles analisarão o despejo de memória para você.

    
por 03.10.2015 / 00:32