memtest86 + travando no servidor

2

Temos alguns servidores DELL 1950. Um desses servidores tem o CentOS 6.3 e está reinicializando aleatoriamente, então eu suspeitei que fosse hardware (nenhum log gerado). Os outros quatro servidores não são reiniciados aleatoriamente.

Nós rodamos o memtest86 + nos cinco servidores e em três deles o memtest86 + travou (exibindo uma tela estranha e colorida, como se uma placa de vídeo falhasse).

Eu testei um memtest86 antigo (não +) e nenhum dos servidores falhou. Eu também testei outros utilitários de teste de RAM, sem nenhuma falha na ferramenta.

Algum de vocês já experimentou isso?

    
por user148723 07.12.2012 / 17:15

3 respostas

3

Se o memtest travar, há uma grande chance de que sua memória esteja ruim. Tente substituir a memória de servidores que não falham e re-executar o memtest. Muito provavelmente a memória é a culpada. Você também pode reduzir a memória para metade (permitindo o sistema; requisitos mínimos de memória) e tentar executar o memtest. Depois de passar, tente substituir a memória pela outra metade e veja.

    
por 22.12.2012 / 09:44
1

Eu tenho um servidor Linux que está reinicializando, isso geralmente significa que é um problema de hardware. Verifique os registros no Dell OMSA (Nó Gerenciado pelo Administrador do Sistema Dell Open Manager). ou via DRAC (cartão de acesso remoto da Dell).

Entre em contato com o suporte técnico da Dell para ajudá-lo na investigação do problema.

    
por 07.12.2012 / 17:35
1

Outra ferramenta para manter em mãos que é extremamente útil para ajudar a testar e diagnosticar é o UBCD. inclui o memtest e o memtest +. A nova versão ainda tem um testador de memória para GPUs. Isso será útil se você suspeitar que o vídeo tenha problemas também.

    
por 22.12.2012 / 09:15