Não há uma resposta para suas perguntas, cada marca / modelo / arquitetura pode ser ou é muito diferente. Normalmente você pode encontrar os detalhes da sua máquina no site do fabricante, mas não há regras de ouro.
Como os locais de memória são divididos entre os bastões de memória RAM?
Recentemente, atualizei de quatro unidades DIMM de 1 GB para quatro unidades DIMM de 2 GB (o servidor diz especificamente que ele suporta os sticks DDR2 DIMM de 2 GB). No entanto, depois de colocar as quatro novas baquetas de 2 GB, a máquina não inicializava e o alto-falante do PC emitia um sinal sonoro alto, presumivelmente indicando uma falha no DIMM. Removendo um stick de cada vez e tentando inicializar, descobri que se a RAM no DIMM2 não estivesse presente, a máquina seria inicializada. Eu então corri o memtest86 + por cerca de 10% de um passe e os 6GB pareciam estar ok.
Eu decidi então mover o DIMM3 (trabalhando) para o soquete para o DIMM2 (tentando testar se o soquete do DIMM2 estava com defeito) e isso foi bem inicializado. Então tentei colocar o DIMM questionável no soquete DIMM3. Para minha surpresa desta vez o computador inicializou, porém rodando o memtest86 +, ele encontrou ~ 15 erros em cerca de 5% de um passe. No entanto, eu ingenuamente esperava que os erros estivessem em um local entre 6144-8192 MB ou pelo menos todos confinados a um bloco contínuo de 2048 MB de RAM. Em vez disso, descobri que os erros de memória estavam espalhados pelos locais. (Por exemplo, alguns foram agrupados em ~ 500 MB, alguns agrupados em torno de ~ 4500 MB - não registrei os locais exatos).
No entanto, eu removi o DIMM questionável no DIMM3 e reran o memtest86 +. Um passe completo foi concluído sem erros nos 6 GB de RAM. Neste ponto, estou convencido de que o DIMM questionável está com defeito - mas estou um pouco perplexo com os erros anteriores do memtest86 +.
As localizações de memória não são apenas agrupadas consecutivamente? (Por exemplo, DIMM0 é 0-2048MB, DIMM1 2048-4096MB, ...) ou é dividido mais (por exemplo, DIMM0 tem byte 0,4,8,12; DIMM1 tem byte 1,5,9,13)? Ou um DIMM ruim pode produzir erros de memória em locais que pertencem a outros sticks do DIMM?
Como disse Chopper3, não há mapeamento garantido de soquetes para locais de memória - isso depende da implementação da unidade de gerenciamento da placa-mãe / memória. Really Good Systems (hardware IBM) tem poucas luzes que piscam ao lado do componente defeituoso, portanto, se você conseguir que o MemTest86 gere um erro detectado pelo IPMI local / outras ferramentas de monitoramento, ele apontará diretamente para o componente defeituoso. Esse recurso sozinho justifica o preço do hardware da IBM na minha opinião: -)
Re: a reprodutibilidade dos erros, infelizmente RAM defeituosa, muitas vezes falha de forma errática (Está tudo bem hoje, totalmente destruído amanhã de manhã, depois volta a ficar bem pela tarde). Executar o MemTest86 + ou outra ferramenta de teste de software continuamente durante a noite é geralmente uma boa maneira de obter erros, mas como você já sabe qual DIMM é (provavelmente) defeituoso, você pode ir direto para a substituição.
Tags memory