Problema com o RAID5

0

Eu tenho um servidor CentOS com RAID5. Toda vez que o RAID5 sincroniza novamente o servidor, pare de funcionar. A empresa de hospedagem interrompeu o serviço httpd para que o RAID5 pudesse ser sincronizado novamente, um processo que pode levar de 3 a 4 horas.

O problema ocorre com frequência, então a empresa de hospedagem trocou meu hardware de servidor e eu migrei para um novo hardware. Eu ainda tenho esse problema (no novo servidor).

Isso é algo normal no RAID5? Como podemos resolver esse problema permanentemente? Se toda vez que o RAID5 quiser sincronizar novamente as sobrecargas do meu servidor e meu site não estiver acessível, o RAID5 será uma droga.

Eu realmente aprecio se você puder sugerir uma solução para esse desastre.

Aqui está o relatório / proc / mdstat:

root@host [~]# watch 'cat /proc/mdstat'
Every 2.0s: cat /proc/mdstat                            Mon May  9 01:25:30 2011

Personalities : [raid1]
md0 : active raid1 xvda1[0] xvdb1[1]
      104320 blocks [2/2] [UU]

md1 : active raid1 xvda2[0] xvdb2[1]
      2096384 blocks [2/2] [UU]

md2 : active raid1 xvda5[0] xvdb5[1]
      484086528 blocks [2/2] [UU]
      [=====>...............]  resync = 29.5% (142978880/484086528) finish=77.7m
in speed=73108K/sec

unused devices: <none>
    
por bman 09.05.2011 / 07:35

1 resposta

2

O RAID só deve ser ressincronizado após uma falha do servidor ou a substituição de um disco com falha. É sempre recomendável usar um no-break e configurar o sistema para desligar com bateria fraca, para que não seja necessário ressincronizar a inicialização. O NUT ou o acpupsd podem conversar com muitos UPSs e iniciar um desligamento antes que o no-break seja descarregado. Se o servidor estiver ressincronizando fora de uma falha, você provavelmente terá um problema de hardware. Verifique o log do kernel em /var/log/kern.log ou executando dmesg . Também recomendo configurar mdadm para enviar um e-mail ao administrador e executar smartd em todas as unidades de disco configuradas de forma semelhante para enviar e-mail ao administrador. Recebo um email cerca de metade do tempo antes de ver um disco com falha. Se você está tendo falhas inevitáveis, você deve ativar um bitmap de intenção de gravação no RAID. Isso mantém um diário de onde o disco está sendo gravado e evita uma nova sincronização na reinicialização. Ative-o com:

mdadm -G /dev/md0 --bitmap=internal
    
por 09.05.2011 / 07:59

Tags