memtest86 + erros - como os locais de memória são divididos entre vários DIMMs?

2

Como os locais de memória são divididos entre os bastões de memória RAM?

Recentemente, atualizei de quatro unidades DIMM de 1 GB para quatro unidades DIMM de 2 GB (o servidor diz especificamente que ele suporta os sticks DDR2 DIMM de 2 GB). No entanto, depois de colocar as quatro novas baquetas de 2 GB, a máquina não inicializava e o alto-falante do PC emitia um sinal sonoro alto, presumivelmente indicando uma falha no DIMM. Removendo um stick de cada vez e tentando inicializar, descobri que se a RAM no DIMM2 não estivesse presente, a máquina seria inicializada. Eu então corri o memtest86 + por cerca de 10% de um passe e os 6GB pareciam estar ok.

Eu decidi então mover o DIMM3 (trabalhando) para o soquete para o DIMM2 (tentando testar se o soquete do DIMM2 estava com defeito) e isso foi bem inicializado. Então tentei colocar o DIMM questionável no soquete DIMM3. Para minha surpresa desta vez o computador inicializou, porém rodando o memtest86 +, ele encontrou ~ 15 erros em cerca de 5% de um passe. No entanto, eu ingenuamente esperava que os erros estivessem em um local entre 6144-8192 MB ou pelo menos todos confinados a um bloco contínuo de 2048 MB de RAM. Em vez disso, descobri que os erros de memória estavam espalhados pelos locais. (Por exemplo, alguns foram agrupados em ~ 500 MB, alguns agrupados em torno de ~ 4500 MB - não registrei os locais exatos).

No entanto, eu removi o DIMM questionável no DIMM3 e reran o memtest86 +. Um passe completo foi concluído sem erros nos 6 GB de RAM. Neste ponto, estou convencido de que o DIMM questionável está com defeito - mas estou um pouco perplexo com os erros anteriores do memtest86 +.

As localizações de memória não são apenas agrupadas consecutivamente? (Por exemplo, DIMM0 é 0-2048MB, DIMM1 2048-4096MB, ...) ou é dividido mais (por exemplo, DIMM0 tem byte 0,4,8,12; DIMM1 tem byte 1,5,9,13)? Ou um DIMM ruim pode produzir erros de memória em locais que pertencem a outros sticks do DIMM?

    
por dr jimbob 28.07.2011 / 19:49

2 respostas

2

Não há uma resposta para suas perguntas, cada marca / modelo / arquitetura pode ser ou é muito diferente. Normalmente você pode encontrar os detalhes da sua máquina no site do fabricante, mas não há regras de ouro.

    
por 28.07.2011 / 20:10
2

Como disse Chopper3, não há mapeamento garantido de soquetes para locais de memória - isso depende da implementação da unidade de gerenciamento da placa-mãe / memória. Really Good Systems (hardware IBM) tem poucas luzes que piscam ao lado do componente defeituoso, portanto, se você conseguir que o MemTest86 gere um erro detectado pelo IPMI local / outras ferramentas de monitoramento, ele apontará diretamente para o componente defeituoso. Esse recurso sozinho justifica o preço do hardware da IBM na minha opinião: -)

Re: a reprodutibilidade dos erros, infelizmente RAM defeituosa, muitas vezes falha de forma errática (Está tudo bem hoje, totalmente destruído amanhã de manhã, depois volta a ficar bem pela tarde). Executar o MemTest86 + ou outra ferramenta de teste de software continuamente durante a noite é geralmente uma boa maneira de obter erros, mas como você já sabe qual DIMM é (provavelmente) defeituoso, você pode ir direto para a substituição.

    
por 28.07.2011 / 20:19

Tags