Existe uma maneira de impedir que um SW RAID 1 seja degradado?

1

Eu tenho um número de servidores Debian em um datacenter e de vez em quando eu noto que o O software RAID 1 foi degradado. Enquanto o processo de re-sync inicia automaticamente e eu não perco nenhum dado, eu acho irritante, pois ele retarda os servidores até mesmo durante dias, enquanto os HDDs estão re-sincronizando.

Eu estava me perguntando o que exatamente faz com que os HDDs dessincronizem e se há alguma opção de configuração para evitar que isso aconteça.

Quaisquer pensamentos / sugestões sobre este assunto seriam muito apreciados.

    
por Alex Flo 14.08.2012 / 15:01

1 resposta

4

Você também pode querer verificar a existência de um trabalho cron que executa regularmente uma verificação RAID nos espelhos. Isso pode parecer muito como uma ressincronização enquanto está acontecendo.

Nos sistemas do tipo CentOS, é feito por /etc/cron.weekly/99-raid-check ; Eu não sei o que seria em um sistema Debian, no entanto.

Editar : É uma tarefa cron semanal que executa uma verificação de RAID, o que faz com que os discos executem algo muito parecido com uma ressincronização de RAID. Isso não é o mesmo que apenas verificar se o RAID falhou; a linha substantiva é echo "check" > /sys/block/$dev/md/sync_action . Se você está dizendo que você constantemente encontra suas matrizes RAID ressincronizando, isso pode ser o que está mordendo você. Se você está dizendo que eles constantemente relatam que a não recuperação está degradada, não é isso.

Se você acha que pode ser isso, você terá que olhar para onde o Debian mantiver suas tarefas semanais / mensais.

Editar 2 : este arquivo em /sys não é um arquivo real, é um artefato do kernel. Você precisa descobrir qual cron job está escrevendo check nesse arquivo e pará-lo. Sinto muito, mas tenho pouca experiência com o debian e não sei onde ele mantém seus arquivos cron do sistema. Mas se você procurar, você deve ser capaz de encontrar o equivalente local do meu /etc/cron.weekly/99-raid-check , e editá-lo (ou um arquivo de recursos depende) para que ele não faça isso, ou apenas excluí-lo.

Editar 3 : você pode tentar

echo idle > /sys/block/md0/md/sync_action

para interromper uma verificação de sincronização em andamento. Mas tem sido um tempo desde que eu tive que desativar um meio-cheque, então eu não posso jurar sobre isso.

    
por 14.08.2012 / 15:12