Parece um caso de má sorte para mim até agora. 24 discos, dois falham na mesma semana? Pena, mas isso pode acontecer. Especialmente se os discos em questão forem unidades de 7,2K RPM não destinadas a operação 24x7. Não vejo nenhuma unidade de 500 GB nas folhas QuickSpecs dos atuais produtos LeftHand, mas sei que a HP vendeu unidades SATA de 500 GB e 7,2 K, já que tenho muitas delas em um MSA1500.
Se esses são de fato os mesmos que eu tenho, não estou surpreso. Eles vieram de um modelo anterior de unidades SATA que não eram tão confiáveis quanto suas contrapartes SAS / SCSI, por isso mostraram uma taxa de falhas maior aqui. Depois do primeiro ano, porém, as maçãs podres saíram e eu não tive nenhuma falha desde então. Mas eu estava passando por um por mês lá por um tempo. LUNs de 5.5 TB são os maiores que eu sugiro que sejam executados com essas unidades, já que o tempo de reconstrução (como você provavelmente está aprendendo agora) leva muito tempo.
Se eles são realmente unidades SAS de 450 GB e 15K, isso é muito menos provável, mas ainda dentro do campo de possibilidades. Às vezes essas coisas acontecem.
Mais amplamente, eu sei que a HP gosta de vender nós do LeftHand em pares. Presumindo que essas duas unidades foram obtidas ao mesmo tempo, a probabilidade de que todas as unidades sejam de lotes semelhantes é bastante alta. Como Chris S apontou, os lotes ruins acontecem. Como os conjuntos RAID5 de 5,5 TB podem levar uma semana para serem reconstruídos (não há uma SAN LeftHand para usar, mas sei que para matrizes baseadas em MSA leva uma semana), e durante esse tempo as unidades estão sob uma carga muito maior do que normal, pode causar cascatas de falha. No entanto, você disse "na semana passada", o que sugere que eles foram reconstruindo por um tempo agora e estão apenas procurando o alinhamento suspeito de estrelas que causou os fracassos em primeiro lugar. Se eles sobreviveram ao processo de reconstrução, é menos provável que você tenha um lote muito ruim, talvez apenas um pouco ruim. Mas fique de olho nas taxas de falha.
2 em uma semana é um ponto de dados, não uma tendência. Infelizmente,