O RAID só deve ser ressincronizado após uma falha do servidor ou a substituição de um disco com falha. É sempre recomendável usar um no-break e configurar o sistema para desligar com bateria fraca, para que não seja necessário ressincronizar a inicialização. O NUT ou o acpupsd podem conversar com muitos UPSs e iniciar um desligamento antes que o no-break seja descarregado. Se o servidor estiver ressincronizando fora de uma falha, você provavelmente terá um problema de hardware. Verifique o log do kernel em /var/log/kern.log
ou executando dmesg
. Também recomendo configurar mdadm
para enviar um e-mail ao administrador e executar smartd
em todas as unidades de disco configuradas de forma semelhante para enviar e-mail ao administrador. Recebo um email cerca de metade do tempo antes de ver um disco com falha. Se você está tendo falhas inevitáveis, você deve ativar um bitmap de intenção de gravação no RAID. Isso mantém um diário de onde o disco está sendo gravado e evita uma nova sincronização na reinicialização. Ative-o com:
mdadm -G /dev/md0 --bitmap=internal