Como diagnosticar a RAM?

4

Eu tenho um processo java que é abortado depois de um tempo com o SIGSEGV. Ele começou a acontecer depois que eu atualizei o servidor com mais RAM. Tendo testado em diferentes JVMs, suspeito que possa ser um problema de hardware. Mas nenhum problema foi detectado pelo memtest86.

Então, o que mais posso fazer para detectar a origem do problema? Devo pegar os módulos de RAM um por um para detectar o módulo defeituoso?

O servidor está rodando em 64 bits OpenSuse11.3.

A memória não é uma ECC, parece. Eu tenho um kit disso (3 * 4GB * 2 = 24GB):

link

    
por x-man 11.01.2012 / 21:48

5 respostas

2

Depois de ter olhado as configurações da BIOS, havia uma alternativa "Multiplicador de memória do sistema", que foi definido como 12. Eu mudei essa configuração para "Auto", o acidente não acontece mais. Então, pensei que poderia ajudar outras pessoas com problemas semelhantes.

    
por 16.01.2012 / 23:16
7

Corremos Memtest86 + contra novos sistemas por 48-72 horas, e ao longo dos anos, detectamos muitos erros que não causaram erros Mostrar até o 2º ou 3º dia. Um casal / poucos passes simplesmente não são suficientes.

Além disso, não misture ECC e não-ECC, e sim, você provavelmente terá que remover / juggle / retestar os módulos de RAM para encontrar o culpado.

    
por 11.01.2012 / 23:38
3

Lembre-se de que os segfaults são normalmente devidos a erros de programação como saturação de buffer, uso após livre e desreferenciamento de ponteiro nulo.

    
por 25.10.2012 / 18:11
2

Mais uma sugestão sobre Memtests86 + . O Memtest verificará toda a memória com certeza, mas às vezes a falha da harware só é exibida quando as condições de temperatura da máquina atingem determinados níveis. E o memtest não enfatiza os discos e outras partes do sistema.

Se você acha que a temperatura pode ser um problema, tente rodar o memtest sob condições de temperatura piores que as usuais.

    
por 11.01.2012 / 23:55
0

existe um aplicativo que pode ajudá-lo a verificar se há erros na RAM enquanto você está executando o sistema. Quero dizer, você não precisa reiniciar o sistema e parar o seu trabalho. Verificação de RAM e seu trabalho pode ser executado paralelamente.

memtester

Se você está instalando o Ubuntu, você pode instalá-lo

sudo apt-get install memtester
    
por 09.09.2013 / 02:00