MegaRaid danificar o disco por definir uma unidade para "Offline"?

2

Eu queria testar o desempenho em um RAID10 com uma "unidade danificada". Para simular essa situação, configurei uma única unidade como "Offline" usando este comando:

MegaCli -PDOffline -PhysDrv [45:12] -aAll

A unidade ficou off-line, mas diretamente com esse comando, outra unidade mudou para "failed". Eu verifiquei o status de todas as unidades antes de executar este comando. Todos foram marcados como online.

Definir uma unidade "offline" coloca muita pressão sobre o hardware, portanto, o risco de danificar um disco aumenta muito? Esse comportamento é comum?

Estou usando os drives MegaRAID SAS 9280-4i4e e SATA.

    
por Philip 22.03.2012 / 21:18

2 respostas

3

Não, não há "pressão" no hardware que causa danos. Provavelmente o que aconteceu foi que o software MegaRAID não foi projetado para lidar com uma unidade sendo desligada por comando enquanto era uma parte funcional de uma matriz RAID.

Eu duvido que o disco esteja realmente danificado. O mais provável é que o controlador tenha pensado que sim. Se a unidade estiver danificada, é mais provável coincidência. (Não tenho certeza se ficaria confiante o suficiente nesse diagnóstico, mas estaria disposto a tentar novamente.)

    
por 22.03.2012 / 21:47
1

Até onde eu sei normalmente quando um ataque se torna degradado, somente haverá carga extra nos drives quando ele estiver sendo reconstruído. Uma reconstrução pode acontecer automaticamente se houver um hot spare, caso contrário você precisará iniciá-lo sozinho ou ele será iniciado assim que uma substituição ou sobressalente for adicionada.

Enquanto não houver recriação acontecendo, não deverá haver uma carga extra.

Um raid10 terá apenas um aumento limitado na carga durante uma reconstrução e somente para a unidade que era um espelho da unidade defeituosa.

Um raid5 terá uma penalidade de desempenho muito grande durante uma reconstrução, porque todas as unidades estão envolvidas no processo de reconstrução.

Sua ação em si não deve ter causado nenhum problema (exceto a degradação da invasão). Estou suspeitando que você é a vítima de um bug. A melhor maneira, na minha opinião, para testar a redundância de ataque é apenas tirar a unidade. Não é um cenário que é muito incomum. ; -)

    
por 22.03.2012 / 21:48