No fim de semana, recebi vários e-mails do nosso servidor de armazenamento de rede (apenas uma caixa personalizada com o RAID 1 do software de unidades de disco 2 e 2), indicando que a SMART detectou problemas em uma das unidades.
Eu fiz um status e duas das partições invadidas foram marcadas com falha:
[root@aapsan01 ~]# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb1[1] sda1[0]
104320 blocks [2/2] [UU]
md0 : active raid1 sdb3[1] sda3[2](F)
4064320 blocks [2/1] [_U]
md3 : active raid1 sdb5[1] sda5[0]
1928860160 blocks [2/2] [UU]
md2 : active raid1 sdb2[1] sda2[2](F)
20482752 blocks [2/1] [_U]
Então, eu configurei todas as partições do sda para "failed", removi todos os espelhos sda com sucesso, coloquei uma nova unidade idêntica de 2tb (após o shutdown) e inicializei. Agora, não consigo acessar o login porque as mensagens de erro se repetem depois que o comando md: autodetect raid array é alcançado durante o processo de inicialização. No início, os erros eram algo como:
DRDY err (UNC) -- exception emask media error
Agora recebo erros de E / S. Eu tentei com o drive corrompido removido e, em seguida, com ele novamente. Mesmo show. As descrições que encontrei mostram que isso é um processo simples de recuperação. O que da? Alguém encontra algo parecido? Parece que o processo de inicialização ainda está em andamento, embora esteja levando uma eternidade para passar por cada etapa. Alguém já teve que esperar tanto tempo para chegar ao prompt? Espero que, se eu não conseguir chegar ao prompt, eu possa chegar a algum lugar com o cd de resgate.