Teste do software RAID5, puxando um HDD ao vivo. Péssima ideia?

3

Estou executando o Ubuntu Server 10.10, com o software RAID5 e o LVM em execução. Eu tenho quatro HDDs de 2 TB. Eu também tenho uma unidade de inicialização separada com instantâneos incrementais de sistema completo que são executados a cada quatro horas e todos os dias, semanas, meses e anos. Portanto, mesmo que a matriz RAID falhe totalmente, meus dados não serão perdidos, mas será difícil reorganizar todo o meu sistema.

Eu testei meu software RAID5 outro dia, puxando um HDD enquanto o sistema estava desligado, reinicializando degradado, colocando de volta o HDD, reiniciando e depois recriando após dizer ao mdadm para adicionar novamente a unidade reinserida. Após 10 horas de reconstrução, ele foi bem-sucedido e agora o dispositivo de software RAID5 está limpo novamente!

Agora, quero fazer outro teste. Você diria que é perigoso puxar um dos HDDs enquanto a máquina está funcionando e possivelmente lendo / escrevendo? Eu puxo o cabo SATA, não o cabo de alimentação, para não correr o risco de danificar o disco rígido, mas eu teria perda de dados? Tenho backups muito redundantes em outros HDDs, por isso não há risco de perda permanente de dados, mas não quero ter que reinstalar e reconfigurar todo o meu sistema.

Não é seguro testar? Qual o pior que pode acontecer?

Atualização:

Eu sou o cartaz original. Como fiz essa pergunta sem uma conta e porque ela foi movida para um site diferente do StackExchange, perdi a propriedade da pergunta.

Então eu fiz o teste. Puxei o cabo SATA de um dos quatro discos rígidos e o sistema funcionou perfeitamente.

Aqui está uma captura de tela da interface RAID do Webmin:

Eaquiestáumacapturadeteladeume-mailquerecebidomeuservidor:

Então, para responder a minha própria pergunta, era seguro fazê-lo no meu caso particular.

    
por Drew Gottlieb 07.08.2012 / 19:23

2 respostas

2

Realmente testar a matriz RAID é geralmente uma má ideia. Existem, claro, exceções (se você não sabe ao certo que seu caso é uma exceção, então não é), mas desconectar fisicamente as unidades que não são "hot swap" é sempre uma má idéia, e fazê-lo intencionalmente é ainda pior.

    
por 07.08.2012 / 19:31
0

Você já testou que o software RAID faz o que deveria. Se você puxar o cabo SATA em um disco ativo, embora não seja suposto fazer qualquer dano, é possível que você ainda possa danificar os componentes eletrônicos do disco. Estou assumindo que as unidades não são hot-swap, já que você está falando sobre a remoção do cabo. Se fosse hot-swap, você apenas soltaria a unidade e a deslizaria para fora.

Assim, o "pior que poderia acontecer" é que você quer matar uma unidade ou você mata o controlador de disco on-board. Nenhum dos dois é um bom resultado.

Eu recomendaria não fazendo o teste ao vivo.

    
por 07.08.2012 / 20:35