Gostaria de receber sua opinião sobre uma situação controversa em que me encontrei há alguns dias. Fui encarregado de usar um HP Proliant G6 para propósitos de desenvolvimento com 2 novos (< 2 meses, nunca usados antes) não-HP SSDs usados na configuração RAID1. Eles estão sendo usados para tarefas de desenvolvimento intensivo (cerca de 500 GB por dia); há também HDDs regulares no RAID5, mas discutiremos o array RAID1 aqui.
- Samsung SSD 840 PRO Series
- PLEXTOR PX-256M5Pro
A saída do smartctl para ambos está disponível aqui: link
Edições passadas relevantes
O drive Plextor sempre foi afetado por uma condição de superaquecimento relatada, que eu assumo é devido ao fato de que não é uma parte original
Eu vi uma vez que o RAID1 foi reconstruído após uma reinicialização ocasional do servidor e não consegui explicar o motivo disso.
Evento de falha
Alguns dias atrás, o disco Plextor foi reportado em um estado "Failed":
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, Solid State SATA, 256.0 GB, Failed)
Falso positivo?
Assim, desconectei-o, verifiquei a saída SMART e executei um teste completo (consulte as saídas smartctl acima). O teste passou e, ainda pior, o encosto do drive dá um array RAID1 perfeitamente funcional.
Isso é estranho.
Monitoramento alternativo?
Não sei como permitir que o P410i me diga qual é o motivo específico para o status "Falha" (acho que não é possível), e sei que essas são peças não originais da HP (invalidando assim meu suporte pago da HP ), mas para esse servidor que não é de missão crítica, eu gostaria de ver se ainda é possível continuar usando discos que não são da HP e ainda ter algum tipo de monitoramento de seu status de integridade.
Qual é a sua opinião? Eu tenho 3 perguntas:
- o status de monitoramento do controlador HP deve ser confiável somente quando usado com peças originais? (isso é fácil)
- são esses SSDs (totalmente sem alta qualidade) objetivamente em boa saúde?
- devo dar 100% de confiança aos resultados dos testes SMART?
Obrigado antecipadamente