O que eu acho acabou sendo o problema foi que a unidade raiz (não faz parte do RAID), que é uma unidade de estado sólido, estava sendo excessivamente usada por meio do arquivo de backup para a reformulação.
Além disso, achei um post falando sobre o assunto exato , que basicamente recomenda:
So learn from my mistake, never ever put the –backup-file on ‘volatile’ media like flash.
A E / S foi essencialmente quebrada no drive raiz e não pôde ser usada para nada, incluindo a execução dos comandos necessários para fazer qualquer coisa remotamente útil (como desligar normalmente). Eu forcei a caixa com força e esperei o melhor.
Quando ele voltou, o drive raiz estava funcionando bem. Pelo menos observavelmente. O RAID não montou corretamente porque estava apenas tentando usar os 11 drives originais e não os 20. Eu disse a mdadm
para parar o array e depois montá-lo novamente dos 20 dispositivos que eu conheço. Uma vez que fiz isso, peguei a re-forma de onde parou.