Por que a ressincronização é 10 vezes mais lenta do que o esperado?

2

Dois dias atrás, um dos Barracudas na minha Synology (3 discos como RAID-5) desencadeou alguns avisos de "setor defeituoso". Nenhum dado perdido. Eles não são muitos (62 em 24 horas, e mais nenhum) e de acordo com as informações da SMART, a unidade está "bem". Mas ainda assim, é o suficiente para eu substituir o disco. Sua milhagem pode variar, mas, para mim, qualquer coisa diferente de zero em termos de setor ruim é NG.

Então ... graças a uma grande livraria on-line que também vende discos rígidos, eu obtive discos de substituição do mesmo tamanho (Ironwolf) literalmente durante a noite.

Primeiro, conectei um no 4º slot e alterei o tipo de array para RAID-6 enquanto o disco antigo ainda estava ativo e funcionando, para adicionar alguma redundância extra. É melhor estar no lado seguro, apenas no caso. Uma vez feito isso, o próximo passo será substituir os discos antigos, um por um.

Então ... ele está ressincronizando no momento.

Eu alterei as configurações de "menos impacto" para "ressincronizar mais rápido", o que aparentemente interfere nas prioridades de IO. O impacto é muito perceptível, tentar acessar um compartilhamento é muito, muito lento agora (mas é claro que ainda funciona). Tudo bem, afinal de contas, queremos que a ressincronização termine logo antes que algo mais drástico possa acontecer. Ainda assim, o uso do disco é apenas 60-56% em cada disco no monitor de recursos. Bem, isso não é tão ruim, eu acho.

O novo disco é capaz de sustentar gravações sequenciais de 150 MB / s e os discos antigos não devem ter nenhum problema em entregar isso durante a leitura sequencial (até mais, já que há três deles, reduzindo a largura de banda necessária). 60% disso é algo em torno de 90 MB / s. Eles são discos de 4 TB.

Sejamos pessimistas e presumamos que apenas obtêm um total de 50 MB / s. Então, isso é 4*(1024*1024)/50 segundos para executar a ressincronização ou apenas um pouco mais de 23 horas.

Eu deixei a coisa sozinha fazendo seu trabalho durante a noite, e ela está funcionando por 26 horas. Olhando para a janela de status, ela mostra 11% completos.

Não há nada que eu possa fazer sobre isso de qualquer maneira, mas seriamente ... o que há de errado? 11% após 26 horas significa que levará quase duas semanas. O que?

Isso está além da minha compreensão. Existe alguma razão técnica pela qual levaria tanto tempo?

    
por Damon 19.09.2018 / 16:39

1 resposta

2

Você começou com isso:

eterminarácomisso:

Quando você converteu para RAID6 você iniciou uma operação, para adicionar um bit de paridade a cada disco na matriz, incluindo o disco 'que está morrendo'. Se esse disco estiver morrendo, provavelmente será muito lento para gravar quaisquer dados, que podem ter sido previamente ocultados pelos outros discos, sendo rápidos para gravar dados e a reprodução lenta do disco é constante.

Além do mais, é provável que esses dados de paridade sejam recriados para cada disco, em vez de apenas copiar os dados de paridade existentes, o que significa que todos os discos devem ser lidos e calculados. / p>

Depois, há os dados factuais de cada um dos discos existentes que agora são movidos para o novo disco e, provavelmente, reorganização dos dados existentes em cada um dos discos existentes, para acelerar o acesso.

Ao todo, você está olhando para até 3x as leituras e gravações (para 4 unidades) para mover os dados para o layout RAID6, em vez de copiar e gravar um disco para outro (1x, 1xwrite). / p>

Além disso, assim como todo esse trabalho de movimentação de dados, você não tem uma sala infinitamente grande para carregar os dados enquanto trabalha nela. As restrições de memória RAM também retardarão qualquer processamento e, como você viu os acessos a arquivos durante esse processo, elas também diminuem a velocidade. Finalmente, muitas das caixas NAS pré-construídas têm CPUs com pouca capacidade, o que geralmente é bom para a operação normal, coisas como ressincronização e mudanças de arquitetura acabam demorando muito.

É por isso que demora tanto tempo.

    
por 19.09.2018 / 22:29

Tags