O R em RAID significa R edundant.
O RAID 5 é N+1 redundant
: Se você perder um disco, estará em N
- O sistema continuará funcionando bem, desde que você não perca outro. Se você perder um segundo disco, agora estará em N-1
e seu universo entrará em colapso (ou, no mínimo, você perderá muitos dados).
Como o SvenW disse, substitua o disco O MAIS RÁPIDO POSSÍVEL (Siga as instruções da sua distribuição para substituir discos em matrizes RAID md e, pelo amor de Deus, certifique-se de substituir o correto disco! Puxar um dos discos ativos vai realmente estragar o seu dia.)
Além disso, esteja ciente de que, quando você substitui um disco em um RAID 5, há muita atividade de disco resultante à medida que a nova unidade é recriada (muitas leituras nos discos antigos, muitas gravações no novo disco). Isso tem duas implicações principais:
-
Seu sistema ficará lento durante a reconstrução.
Quão lento depende de seus discos e do subsistema de E / S de disco. -
Você pode perder outro disco durante / logo após a reconstrução.
(Toda essa E / S de disco, às vezes, dispara erros suficientes de outra unidade que o controlador declara "ruim").
As chances de # 2 aumentam à medida que você tem mais discos em sua matriz e segue a "curva da banheira" padrão de mortalidade do disco rígido. Isso é parte do motivo pelo qual você deve ter um backup, e uma das muitas razões pelas quais você ouve o mantra "RAID não é um backup" repetido tantas vezes no ServerFault.