Eu estou projetando um sistema que inclui um computador de controle baseado no Linux (Debian). Ele será implantado em um local remoto e inacessível. Eu quero configurá-lo de tal forma a maximizar a chance de que ele pode inicializar, apesar de falhas no disco ou corrupção.
Até agora, eu configurei dois DOMs industriais SATA no RAID 1 (espelhado) com o GRUB carregado em ambos os MBRs. Isso parece funcionar muito bem: eu posso desconectar a unidade e o sistema ainda será executado e reinicializado.
No entanto, eu encontrei uma situação em que uma unidade foi corrompida e, em seguida, na reinicialização do RAID não conseguiu montar, mas o sistema tentou inicializar a unidade corrompida e ficou preso.
Se eu detectar que uma unidade falha na matriz RAID 1 enquanto o sistema está em execução, a coisa mais segura a fazer seria dd
zero a unidade com falha para garantir que o sistema não tente usar a unidade corrompida e passar para o próximo?
Seria mais confiável tornar as duas unidades idênticas e não usar RAID 1 e, em seguida, se uma unidade falhar, desativá-la da inicialização na BIOS?