Olá a todos os membros e saudações da Grécia
Eu tenho uma situação bastante incomum e estou ficando sem ideias. Eu tenho este servidor antigo (IBM x205 - P4 2.4Ghz, 3xSCSI 36gb) e cerca de um ano atrás, decidi usá-lo como um controlador de domínio adicional e fax & servidor de arquivos. Para esta tarefa eu tive um cartão Delock 70154 SATA juntamente com 2x320 SATA II HDDs
Tudo estava indo muito bem até cerca de três semanas atrás. Eu estava em uma viagem e fui informado quando voltei que o servidor foi encontrado congelado. Bem, eu considerei que era uma falha desde um simples desligar / ligar tudo fixo. Mais uma vez, duas semanas atrás, outra situação de congelamento. Ele ficou suspeito, mas novamente depois de um desligamento / ligar tudo estava funcionando.
Mais uma vez ele congelou e, quando eu liguei, veio uma mensagem dizendo que os serviços do domínio não puderam ser iniciados devido à corrupção do NTDS. A inicialização em modo de segurança revelou que houve um problema com o SATA Raid (degraded).
Depois de muita pesquisa, eu degradai o servidor, limpei o Active Directory, tirei ambos os HDDs (um deles era realmente BAD) e recuperei meus arquivos (eu tive alguns problemas com o Delock lida com o HDD redudante).
Neste momento, o meu servidor é simples, com apenas o que a fábrica instalou. Aqui é onde a diversão começa. Todos os dias, quando chego ao escritório, acho essa máquina em particular morta e quero dizer, totalmente morta. Apenas uma tela preta e nada mais. O ventilador da CPU está funcionando, a PSU está funcionando. O teclado e o mouse estão mortos (eles também bloqueiam meu KVM), assim como a rede. A máquina está morta.
Eu o ponho com força e depois o energizo. Durante as 8 horas em que estou no escritório, ele funciona, seja em marcha lenta ou executando algum tipo de diagnóstico. Quando saio do escritório, depois de algum tempo (talvez depois de 30 minutos, talvez depois de 4 horas) a máquina morre. Esta é a informação que o log de eventos mostra
"the previous shutdown at xx:xx:xx was unexpected"
Eu tentei o seguinte:
Memtest: nada apareceu
Passmark burn in test: nada apareceu
Estudo cuidadoso do log de eventos: nada de interesse que eu possa ver
Defina a opção de não iniciar automaticamente após uma falha para que eu possa ver BSODs: nada a ver
O esquema de energia está definido para nunca dormir.
Eu sei que existem muitas outras ferramentas que enfatizam strongmente uma máquina como o OCCT, mas a máquina é antiga. Hoje eu lhes darei uma tentativa no entanto. Uma idéia é reformatá-lo, mas eu realmente gosto de encontrar o que está causando isso, porque eu poderia chegar a uma situação em que tudo está funcionando por um tempo e, em seguida, kaboom, um dia, novamente, está morrendo. Eu realmente preciso de uma mão amiga e toda opinião / idéia é bem-vinda. Eu sei que a solução óbvia é nunca sair do escritório, mas tenho uma vida. Desculpe servidor. :)
P.S Esta situação com a máquina morrendo já dura cerca de uma semana. Todos os dias gostaria de definir o RAID para reconstruir ou para copiar / recuperar arquivos e enquanto everythig estava trabalhando