Re-forma do RAID do Linux foi interrompida

0

Nas últimas 8 horas, meu processo de mdadm re-shape foi bloqueado. A saída é:

Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] 
md0 : active raid6 sdo[11] sdn[12] sdm[13] sdl[14] sdk[15] sdj[16] sdi[17] sdh[20](F) sdg[19] sdr1[1] sds1[2] sdt1[3] sdu1[4] sdp1[10] sdq1[6] sde1[0] sdd1[7] sdb1[9] sdc1[8] sdf1[5]
      17581607424 blocks super 0.91 level 6, 64k chunk, algorithm 2 [20/19] [UUUUUUUUUUUUUUUUUU_U]
      [====>................]  reshape = 23.2% (453532992/1953511936) finish=6484322.5min speed=3K/sec

A contagem foi exatamente 453532992 o tempo todo, com a velocidade diminuindo em direção a 0 (não atingindo, já que é uma velocidade média e a velocidade estava boa por um longo tempo antes). Eu posso ver que uma das unidades foi marcada como falhada, o que me deixa um pouco preocupado. Eu posso re-construir nessa unidade (eu sei que não é uma falha de hardware) uma vez que a re-forma é feita, mas a esse ritmo isso não está acontecendo.

Alguém tem alguma sugestão? Existe algo que eu possa fazer para voltar a mdadm ?

Editar: Para aumentar a diversão, parece que algo deu errado no sistema. Estou recebendo erros de E / S quando tento ler qualquer coisa no sistema de arquivos raiz. O sistema de arquivos RAIDed ainda está ativo e em execução, mas alguns processos estão presos e não me permitem desmontá-lo. E os erros no sistema de arquivos raiz parecem estar impedindo uma reinicialização limpa.

Então, suponho que seja possível que todos os problemas estejam no dispositivo raiz e nada a ver com o RAID, ele não pode continuar a se remodelar porque não pode ler algo precisa? Não tenho certeza. Mas se eu não puder fazer uma reinicialização limpa, o que aconteceria com a reformulação se eu precisasse reinicializar a caixa? E se o drive raiz estiver fisicamente morto e eu precisar instalar o sistema operacional em uma nova unidade? O que aconteceria com o array então?

    
por David 20.10.2012 / 11:17

1 resposta

0

O que eu acho acabou sendo o problema foi que a unidade raiz (não faz parte do RAID), que é uma unidade de estado sólido, estava sendo excessivamente usada por meio do arquivo de backup para a reformulação.

Além disso, achei um post falando sobre o assunto exato , que basicamente recomenda:

So learn from my mistake, never ever put the –backup-file on ‘volatile’ media like flash.

A E / S foi essencialmente quebrada no drive raiz e não pôde ser usada para nada, incluindo a execução dos comandos necessários para fazer qualquer coisa remotamente útil (como desligar normalmente). Eu forcei a caixa com força e esperei o melhor.

Quando ele voltou, o drive raiz estava funcionando bem. Pelo menos observavelmente. O RAID não montou corretamente porque estava apenas tentando usar os 11 drives originais e não os 20. Eu disse a mdadm para parar o array e depois montá-lo novamente dos 20 dispositivos que eu conheço. Uma vez que fiz isso, peguei a re-forma de onde parou.

    
por 21.10.2012 / 23:03