Erros de ECC, nenhum erro de teste de Mem

1

Adquiri recentemente uma estação de trabalho HP XW6400 (Dual CPU, Quad memory channels) Junto com o computador, comprei 2 sticks de RAM da mesma marca e aparência, mas não correspondentes (números e adesivos secundários não correspondem, mas eles deveriam estar combinando) e 2 CPUs Xeon 5160. Depois de colocar tudo junto, eu tinha correções regulares de ECC que foram anotadas na inicialização, então eu comprei mais sticks de RAM que estavam combinando; depois de instalar o próximo conjunto de memória, recebi os mesmos erros. Então eu comprei uma placa-mãe e ainda tenho os mesmos erros. O controlador de memória não está integrado ao processador, então não tenho prestado muita atenção a eles. Eu corro o memtest para uma rápida corrida de 2 horas em cada stick individualmente e nenhum erro aparece em nenhum dos bastões. Mas ainda recebo correções ECC em muitas reinicializações. Algumas vezes ele corrige os erros, outras vezes são erros incorrigíveis fatais.

Eles são pequenas coisas quentes, então eu virei o ventilador logo acima deles para que o ventilador sopre nelas. Northbridge é resfriado por um ventilador também. Temps via monitor de hardware tudo parece normal.

Além disso, se eu colocar todos os 4 paus, ele irá travar dentro de minutos de começar quase todas as vezes. Onde com 2 varas, quase nunca trava (usado por 2 semanas antes de eu comprar uma nova prancha); apenas observa as correções do ECC ou erros na reinicialização.

Toda a memória é DDR2 5300F Memória ECC totalmente armazenada em buffer.

O primeiro conjunto é a memória HP, mas pelos números e adesivos, eles não são um par combinado, mas à primeira vista parecem iguais. a maioria dos números também é equivalente. Mas eles são fabricados em diferentes partes do mundo (Cingapura e Porto Rico)

O segundo conjunto é a memória Kingston, mas é um par combinado.

Minha hipótese é que a memória Kingston está tendo problemas de compatibilidade no modo de dois canais, e a memória HP não é um conjunto compatível que causa problemas no modo de compatibilidade dupla e todos os quatro juntos é um pesadelo de compatibilidade para canais quad acima. Mas, na verdade, estou apenas esfaqueando no escuro. Alguma idéia?

    
por Damon 30.01.2014 / 11:12

1 resposta

2

Eu acho que havia uma BIOS ruim e uma CPU ruim trabalhando em conjunto uma com a outra e acho que a memória, embora não seja a ideal, não é realmente a questão principal. daí o esfaqueamento no comentário sombrio.

No passado, eu tinha um erro de barramento frontal da CPU intermitentemente que eu estava atribuindo a problemas de memória ou da placa-mãe. Eu encontrei um documento da HP que diz que o BIOS original realmente tem problemas e para atualizar, então atualizei o BIOS.

Em seguida, as coisas correram um pouco melhor em que eu poderia correr com todos os 4 sticks de memória sem bater, Então, em seguida tentei resolver os CPUs executando um "teste" multitarefa de passmark no sistema que gravou na memória e corri números primos, e executou o teste seco e de pedra de amolar todos ao mesmo tempo. Antes disso, durante todo o processo, eu propositalmente havia trocado os locais da CPU para o caso de o erro do FSB aparecer novamente. Muito rapidamente BSOD tinha o computador e não iria simplesmente reiniciar. Após a reinicialização, (depois de ter um inferno de tempo para fazê-lo reiniciar) me deu uma nova mensagem de erro para a CPU para um erro de barramento frontal e um sub erro adicional para o FSB na mesma CPU que a que tinha o erro do FSB no passado (soquete diferente). Além disso, o computador congelava enquanto vasculhava o BIOS e eu não conseguia inicializá-lo no Windows. Então, eu removi a CPU suspeita, reiniciei, funcionou e executei o mesmo teste novamente, mas por mais tempo. Nenhuma falha, nenhum erro (ainda) e tudo até agora parece estável.

Às vezes você ganha com coisas usadas, às vezes você perde. Eu acho que este é oficialmente um daqueles momentos perdidos em quanto tempo isso tudo tem perdido. Vamos apenas esperar que seja por problemas.

    
por 31.01.2014 / 02:20