Eu gerenciei milhares de servidores HP Prolient com várias configurações de RAID em um grande datacenter (64.000 pés quadrados). Normalmente, há duas situações em que eu substituo as unidades, em caso de falha ou com falha de previsão. No entanto, o último IMHO é muito como "em algum momento no futuro esta unidade vai falhar." Ouvi dizer que tem algo a ver com comunicação ou problemas de monitoramento com a HP.
Sugiro que você sempre substitua um disco se ele falhar mesmo que o servidor tenha um hot spare. Eu odeio usar essa frase, mas acho que a lei de Murphy. No entanto, algumas coisas vêm à mente.
- Nível de suporte com a HP. Você tem um contrato de suporte com eles?
- Qual é a importância da caixa?
- Acessibilidade técnica de campo. Um CE pode chegar lá rapidamente?
- Disponibilidade de peças da HP.
- Uma questão bastante importante é o orçamento do departamento. Você pode substituí-los?
Mais uma vez, estas são apenas algumas das coisas que lhe vêm à mente.
Quanto a medidas preventivas, um bom ambiente limpo com temperatura e umidade dentro da ASHRAE ( um post rápido aqui ) ou fabricar especificações é sobre o melhor que você pode fazer. Além disso, um bom monitoramento ajuda muito a detectar esses problemas, pois eles minimizam o tempo de inatividade. Você pode dar uma olhada em Hp Insight . Pessoalmente, eu fico longe dos agentes hp e monitore rigorosamente os servidores de sua interface integrada (iLo) com ajuda de
Quanto às estações de trabalho, as opções acima ainda podem ser aplicadas. Você nunca deve estar em uma situação em que você precise se recuperar do backup. E simplesmente substituir discos para substituí-los não é uma maneira de executar um servidor / estação de trabalho. Então, novamente, eu não gerencio estações de trabalho, então algumas delas podem ser exageradas.