Faz sentido instalar memória sobressalente on-line?

6

Estou usando o HP DL360p Geração 8. Eu preciso de um servidor bastante confiável, então eu ' m usando RAID 1 com uma unidade sobressalente e também adicionei uma fonte de alimentação extra. Mas devo instalar memória sobressalente online? Ou está apenas perdendo dinheiro?

    
por javapowered 24.04.2012 / 14:18

3 respostas

5

Não vale a pena. Com a RAM ECC e a execução de agentes de gerenciamento da HP, é muito fácil detectar memória ruim. Normalmente, existem alguns passos para intervir antes de ver um grande problema que afeta a operação. Sob o suporte padrão, a substituição de RAM é o próximo dia útil, portanto, não há necessidade de complicar o arranjo de RAM, adicionando DIMMs sobressalentes.

O pior problema de memória do HP ProLiant que eu tive em um sistema acabou por travar o servidor após vários alertas de ECC que ocorreram ao longo de uma semana. Os erros vieram, o servidor foi reinicializado por meio de um ASR e a máquina retornou com o DIMM incorreto desativado. Este foi um sistema HP ProLiant DL580 G4 e os registros de erros foram os seguintes ...

0004 Repaired       22:21  12/01/2008 22:21  12/01/2008 0001
LOG: Corrected Memory Error threshold exceeded (Slot 1, Memory Module 1)

0005 Repaired       20:41  12/06/2008 20:43  12/06/2008 0002
LOG: POST Error: 201-Memory Error Single-bit error occured during memory initialization, Board 1, DIMM 1. Bank 
containing DIMM(s) has been disabled.

De volta ao dia, eu instalei muitos servidores HP ProLiant DL740 que apresentavam um Matriz de memória estilo RAID5. Portanto, um servidor de 16 GB de RAM, na verdade, tinha 20 GB instalados em bancos de 8 DIMMS com troca a quente. Para as dezenas de servidores que eu implantei e executei por mais de cinco anos, eu só tive um módulo DIMM falhando. Figuras ...

Editar: Você está planejando usar isso em um ambiente de negociação de alta frequência. Você perguntou sobre a latência com a RAM de reposição em um servidor como este. Normalmente, para aplicativos de baixa latência, desativo as verificações de pré-falha de memória em meus sistemas host. Esta é a recomendação da HP na página 7 de seu Configurando o HP ProLiant BIOS do servidor para aplicativos de baixa latência white paper. É uma questão de monitoramento e risco. Eu raramente tenho DIMMs falhar. Você se importa mais com velocidade ou resiliência? Você não vai ficar tanto no nível do hardware ...

    
por 24.04.2012 / 14:40
4

Eu acho que isso é apenas desperdiçar dinheiro. A memória já tem ECC. Dito isto, se o seu servidor for usado 24 horas por dia, 7 dias por semana e não houver tempo de inatividade, isso pode fazer sentido. Se você estiver usando isso para um hipervisor, será simples desligar todas as VMs, desligar o sistema e trocar um chip de memória ruim.

Na minha experiência, os chips de memória high-end do servidor ficam ruins de vez em quando e precisam ser substituídos.

    
por 24.04.2012 / 14:26
4

É uma coisa muito fácil para você decidir - quanto custará ativar o modo online-spare ou o modo lock-step e, em seguida, considerar quanto custaria o impacto das perdas de serviço baseadas em memória durante a vida útil do servidor.

Não usamos nenhum desses métodos em nossos servidores onde esses servidores fazem parte de um cluster de failover existente - Oracle RAC, vSphere etc., mas o usamos onde nossos servidores não podem ser agrupados de nenhuma maneira prática / econômica. / p>

Só você pode decidir com base no custo / benefício, mas a tecnologia funciona, sei que evitamos duas interrupções completas do sistema em um de nossos servidores nos últimos 2,5 anos e, para nós, o investimento valeu a pena sua milhagem pode variar.

    
por 24.04.2012 / 15:31