Problema térmico / TDP do FBDIMM

2

Eu tenho um servidor dual Xeon de 2U com ram 8x 2GB DDR2 FBdim / ECC, em uma placa intel s5000PSL. É estável, os memtests do ram estão limpos e ambos os processadores estão funcionando bem (35C). Metade dos bastões correm ~ 60-65C, o que parece quente para mim, mas está bem dentro do TDP ... MAS há quatro que correm 75-90 + dependendo da carga.

Eu esperaria que fossem difusores de calor ruins, mas é QUALQUER vara nesses quatro slots, não importa como eu os embaralhe. O RAM está ao lado do PSU, há cerca de 3 / 4-1 "entre a borda dos soquetes e o lado do PSU, mas o stick mais próximo do PSU é um dos mais legais, então não está superaquecendo de alguma forma.

Fisicamente é apresentado: C C H C H H C [PSU]

C-legal, H-quente

Eu tentei adicionar um par de ventiladores de 30mm na parte de trás para vazão, e até mesmo alguns dissipadores de calor (removíveis) afundam no topo dos bastões, presos aos espalhadores para ajudar a espalhar o calor para fora - mas ambos pareciam apenas piorar por algum motivo, então estou completamente perplexo.

Alguém tem alguma ideia do que está acontecendo e, especialmente, como corrigir?

EDIT: Eu coloco um duto temporário para direcionar o fluxo de ar da CPU que estava soprando sobre os módulos, para longe deles, 15 minutos depois eu olho, e eles estão ainda mais quentes, um quebrou 97C, escusado será dizer que eu desliguei imediatamente-- eu vou remover o duto e reexecutar um memtest mais tarde para ter certeza de que nada foi danificado.

EDIT # 2: Corri o memtest86 + durante a noite, os resultados foram 100% limpos, o SEL está claro, o log de erro do BIOS está claro, o LED de status do sistema é verde sólido, tudo é 100% rock sólido e limpo ....

Exceto aqueles temps de RAM (slots B1, C1, C2, D1 se eu estou lendo o layout direito), e agora os bips do, eu presumo, o BIOS, que começou alguns dias atrás, depois que eu puxei e recolorei tudo - duas curtas e curtas, três curtas. Eu não consigo encontrar isso em nenhum manual que eu tenho acesso, mas cada teste e teste que eu posso dizer é limpo e sólido.

Eu posso viver com os bips, embora eu gostaria de saber o que eles significam, mas os temps estão me preocupando. A única coisa que eu não tentei é o topo do gabinete com um exaustor de 120/240 mm e eu seriamente preferiria não - mas mesmo com a tampa desligada eles ainda funcionam com 75.

EDIT # 3: Eu fiz um pouco mais de escavação, os slots de RAM estão divididos em dois ramos, cada ramificação tendo dois canais com dois slots. A1 / A2, B1 / B2, C1 / C2, D1 / D2: A partir de agora, ocioso com a tampa desligada, os tempos são os seguintes: A1: 63C / A2: 66C / B1: 71C B2: 60C / C1: 76C C2: 81C / Dl: 81C D2: 67C. Se fosse um canal ou até mesmo um ramo eu pensaria controlador ou algo assim, mas é B1, C1, C2 e D1 que são muito mais elevados do que os outros (eu não notei B1 anteriormente) - nem mesmo B2 / C1 / C2 / D1 todos em um bloco - e é independente da ordem que eu alterno os bastões, então não consigo ver como são os bastões.

Se não for um canal específico ou um bastão específico, não sei o que poderia estar acontecendo. Eu mencionei os bips durante o post anterior, mas não consigo encontrá-los em nenhum manual, e nada que eu possa testar mostra qualquer problema em qualquer lugar, exceto as temperaturas que parecem não ter nenhum motivo.

    
por Christiebunny 03.08.2013 / 01:57

1 resposta

2

Tenho certeza que você tem um problema com o VRM / se / ou bobinas fornecendo energia para esses slots de memória - Eu vi exatamente isso acontecer em um HP DL380 G5 antigo com CPUs Xeon 54xx e FBDIMMs - nós tivemos que trocar a placa de sistema, no nosso caso, foi o suficiente para realmente matar um par de DIMMs.

Ironicamente, os garotos que fazem overclock no Superuser.com conscientemente se esforçam para fazer isso, para que possam obter mais desempenho de memória:)

    
por 03.08.2013 / 10:17