mdadm resync faz com que o sistema pare de responder

2

Temos um servidor no qual um disco de invasão 1 está tentando reconstruir ou sincronizar. O disco está sendo ressincronizado, mas o servidor parou de responder. Não se pode entrar na caixa nem nenhum dos serviços está respondendo. Se você está na lan local, você pode ssh, mas é extremamente lento, de modo a ser inútil.

O que pode estar causando esse problema? Recentemente reconstruímos a máquina com novo disco quando caiu há cerca de um mês. Precisávamos aumentar o tamanho do disco, então aproveitamos a oportunidade para fazer isso. Agora não tenho certeza se existe algum tipo de falha de hardware. Eles são discos sata usando invasão de software.

Geralmente, se um disco ou controlador for acionado, o segundo disco continuará a operar. Não tenho certeza do que está acontecendo agora.

Qualquer ajuda apreciada.

    
por mxc 11.01.2010 / 20:49

2 respostas

4

Sua velocidade de ressincronização é muito alta para seus recursos de E / S de disco. Execute echo 1000 >/proc/sys/dev/raid/speed_limit_max e você verá um rápido retorno à capacidade de resposta. Assim que estiver sob controle, ajuste esse limite de velocidade para um nível adequado ao seu hardware.

    
por 11.01.2010 / 21:34
0

Pode ser que suas partições não estejam alinhadas corretamente. Eu tinha um sistema com dois discos WD1000EARS que tinham partições não alinhadas. Isso teve o mesmo problema. Eu reparticionei o disco, criando partições com parted e verificando o alinhamento. A velocidade de reconstrução saltou para 60-70MB / s e o sistema foi muito responsivo. A carga foi notavelmente menor e a carga i / o da cpu estava muito baixa em comparação com a situação anterior.

    
por 07.09.2011 / 22:06

Tags