Como posso diagnosticar a causa da reinicialização crônica - sem eventos, sem arquivos de despejo, sem mensagens de erro

2

Eu tenho um sistema Windows 7 Pro x64 (i7 se isso importa) que reinicia aleatoriamente.

Este sistema deve estar on-line o tempo todo, mas é reiniciado de maneira aleatória. Eu posso passar 5 dias sem reiniciar aleatoriamente, mas outras vezes ele irá reiniciar 3 vezes dentro de um período de 6 horas, o menor tempo entre as reinicializações que eu observei foi cerca de 1 hora.

Nenhuma mensagem de erro, nenhum pop-up, nenhuma tela azul, nenhum log de eventos em "sistema" ou "aplicativo". Ele está conectado a um no-break, os registros do no-break indicam eventos de energia zero.

Nos registros do sistema, tudo que vejo são informações sobre a recuperação de um desligamento inesperado, mas nenhuma mensagem de erro ou eventos diretamente anteriores.

Originalmente eu estava preparado para fazer dumps do kernel, mas como nunca gerei arquivos de dump dessas reinicializações, pensei em testar o mini-dump, que também não gerava arquivos de despejo.

Quais ferramentas posso usar para diagnosticar o que está acontecendo?

EDIT (para abordar comentários): Nós realizamos uma análise de energia no sistema. O PC é alimentado com uma fonte de 24 V e todas as linhas de energia entre o PC / UPS / Alimentação foram testadas quanto à robustez e níveis de potência precisos.

O PC está em um gabinete com ar condicionado mantido a 20 graus Celsius. O Bios indica que o PC está rodando relativamente bem, cada núcleo roda em torno de 40 graus Celsius, o que me dá muito espaço antes do Tmax.

Eu testei o no-break removendo a energia principal do sistema e observando o no-break aguardar o período de carência de 30 segundos antes de executar um desligamento controlado no sistema.

O sistema em questão e toda a fonte de alimentação associada e o hardware da UPS são relativamente novos, talvez com 4 meses de existência.

O BIOS está usando a revisão mais recente.

Tentarei remover o no-break da equação para ver se há um problema com excesso de corrente, mas como isso nunca foi um problema quando testado, não sei se isso mudará muito.

    
por Gorchestopher H 11.06.2015 / 17:07

0 respostas