O HP Proliant G6 relata falha no drive SSD - estratégias alternativas de monitoramento?

3

Gostaria de receber sua opinião sobre uma situação controversa em que me encontrei há alguns dias. Fui encarregado de usar um HP Proliant G6 para propósitos de desenvolvimento com 2 novos (< 2 meses, nunca usados antes) não-HP SSDs usados na configuração RAID1. Eles estão sendo usados para tarefas de desenvolvimento intensivo (cerca de 500 GB por dia); há também HDDs regulares no RAID5, mas discutiremos o array RAID1 aqui.

  • Samsung SSD 840 PRO Series
  • PLEXTOR PX-256M5Pro

A saída do smartctl para ambos está disponível aqui: link

Edições passadas relevantes

O drive Plextor sempre foi afetado por uma condição de superaquecimento relatada, que eu assumo é devido ao fato de que não é uma parte original

Eu vi uma vez que o RAID1 foi reconstruído após uma reinicialização ocasional do servidor e não consegui explicar o motivo disso.

Evento de falha

Alguns dias atrás, o disco Plextor foi reportado em um estado "Failed": physicaldrive 1I:1:1 (port 1I:box 1:bay 1, Solid State SATA, 256.0 GB, Failed)

Falso positivo?

Assim, desconectei-o, verifiquei a saída SMART e executei um teste completo (consulte as saídas smartctl acima). O teste passou e, ainda pior, o encosto do drive dá um array RAID1 perfeitamente funcional.

Isso é estranho.

Monitoramento alternativo?

Não sei como permitir que o P410i me diga qual é o motivo específico para o status "Falha" (acho que não é possível), e sei que essas são peças não originais da HP (invalidando assim meu suporte pago da HP ), mas para esse servidor que não é de missão crítica, eu gostaria de ver se ainda é possível continuar usando discos que não são da HP e ainda ter algum tipo de monitoramento de seu status de integridade.

Qual é a sua opinião? Eu tenho 3 perguntas:

  • o status de monitoramento do controlador HP deve ser confiável somente quando usado com peças originais? (isso é fácil)
  • são esses SSDs (totalmente sem alta qualidade) objetivamente em boa saúde?
  • devo dar 100% de confiança aos resultados dos testes SMART?

Obrigado antecipadamente

    
por Deim0s 10.12.2014 / 11:51

1 resposta

4

Seus SSDs provavelmente são saudáveis, mas o controlador RAID HP Smart Array P410 não é compatível com o todo SSD.

Em particular, alguns SSDs relatam atributos de temperatura incorretos ao controlador que causam problemas térmicos no ventilador do chassi e no sistema. Além disso, qualquer dispositivo SATA usado nesse controlador será downclocked para velocidades de 3Gbps de 6Gbps . Então você está perdendo o potencial de largura de banda.

Obviamente, esta combinação de componentes é uma má combinação. Você pode usar um SSD em bom estado destinado ao uso com o controlador (marca Sandisk / Pliant / Intel / Samsung / STEC da marca HP) ou fazer experimentos com unidades de terceiros até encontrar um que funcione. Eu recomendo Intel e OWC.

Cobri algumas opções de disco que funcionam bem aqui:

Os drives SSD são tão confiáveis quanto os mecânicos? drives (2013)?

e aqui:

storage arrays HP - vários canais?

    
por 10.12.2014 / 12:17