Observe que TODOS os arrays do MD estão em risco --- não apenas o que é "oficialmente" degradado --- pois todos são baseados em apenas dois dispositivos físicos: sda
e sdb
. Espero que você tenha backups adequados e / ou procedimentos de recuperação do sistema em vigor, apenas no caso de as coisas ficarem realmente em forma de pêra. Como Shane Madden observou, o log da ressincronização mostra um erro preocupante que pode estar indicando que sda
é menor que a própria saúde.
A melhor coisa a fazer é puxar sdb
e substituí-lo imediatamente. Se você não tem um substituto à mão, então peça um o mais rápido possível (e talvez use o tempo necessário para fazer um último backup completo de todos os seus arrays enquanto eles ainda estiverem bons!). Sua unidade de substituição precisará ser particionada apropriadamente e, em seguida, as partições serão adicionadas de maneira correspondente a cada uma das suas quatro matrizes. Espero que tudo corra bem e todos os arrays sejam ressincronizados com sucesso.
No entanto, se Shane estiver correto, e outros erros de uma falha sda
impedirem a remontagem / ressincronização adequada, a próxima coisa a tentar será puxar sda
, substituí-lo pelo antigo sdb
(o que pode ainda seja bom), e veja se a combinação do seu antigo sdb
e seu novo disco de substituição remontam e ressincronizam com sucesso.
E, finalmente, se nenhuma das opções acima funcionar, a última coisa a tentar (antes de uma reconstrução e restauração completa do sistema) é substituir o (s) controlador (es) da unidade. Eu vi floco-out controladores de unidade e causar problemas para matrizes saudáveis. Uma maneira de testar se um controlador pode ser a causa de erros MD é colocar uma de suas unidades "com falha" em outra máquina com Linux com um controlador em bom estado e as ferramentas mdadm
instaladas. Como todos os seus arrays são RAID1, os arrays em qualquer unidade individual devem poder ser montados em um estado utilizável (embora degradado), onde é possível verificar sistemas de arquivos, fazer backups e assim por diante.