Falha no disco único no RAID10, tornando os dados indisponíveis

1

Eu tenho uma situação estranha aqui. Eu tenho um Dell R620 com o mini controlador PERC H310. Existem 2 matrizes RAID, um espelho de 2 discos para o SO e um disco de 6 discos RAID 10 para a unidade DATA. Quando um único disco falha no RAID10, meus dados ficam indisponíveis e são listados como inválidos no gerenciamento de disco do Windows. Isso é um comportamento normal? Eu pensei que uma única falha de disco seria simplesmente colocá-lo em um modo degradado até que um novo disco seja adicionado, mas eu perco meu volume completamente. Em uma nota lateral eu tive 3 falhas de disco na última semana. Não acho que sejam questões relacionadas, mas posso estar errado. Obrigado por qualquer ajuda.

    
por Fr0ntSight 06.04.2017 / 21:08

2 respostas

1

Você está absolutamente certo de que uma única falha de disco em uma matriz RAID-10 não deve resultar na indisponibilidade do volume. Algo está provavelmente errado com o seu controlador PERC.

Você deve entrar no Dell OpenManage Server Administrator ou no iDRAC e ver se alguma informação é relatada lá. Você também pode verificar os Logs de Eventos do Windows (se o OSMA estiver instalado e configurado para gravar eventos nesses logs).

Se houver atualizações disponíveis de firmware e / ou driver para o seu controlador ou backplane, considere instalá-las. Eu recomendaria fazer isso enquanto o array é saudável, se possível.

Também é possível que você tenha vários discos com falha. Dependendo de quais discos em um conjunto RAID-10 falharem, você poderá perder mais de um (até 3 no seu caso) sem o array ficar off-line; no entanto, se você perder apenas dois, mas eles estiverem no mesmo par RAID-1, a matriz inteira será desativada.

Não se esqueça de entrar em contato com o suporte da Dell se o sistema ainda estiver na garantia. Eles são muito bons em ajudar a diagnosticar problemas como esse.

    
por 07.04.2017 / 01:04
0

Três falhas de disco em uma semana não são uma situação inconcebível, especialmente se todas foram colocadas em serviço ao mesmo tempo e têm a mesma quantidade de desgaste. No entanto, eu começaria a suspeitar do controlador ou backplane se isso estivesse acontecendo comigo.

Você pode entrar no seu iDRAC e ver se há alguma falha nos registros em relação ao controlador RAID?

Além disso, você está executando verificações SMART nos discos que falharam e nos membros em execução no momento? Isso revelaria se o disco em si era ruim e daria a você uma pista de como eles poderiam estar falhando se fossem. O aplicativo smartctl faz parte do pacote smartmontools e está disponível para instalação e uso em um ambiente Windows. Consulte a página do manual para saber como acessar os drives através do seu controlador RAID, especificamente a opção -d.

    
por 06.04.2017 / 22:28