Recentemente, tive problemas com um servidor sendo desligado aleatoriamente. Eu percebi que eram sinais de falha de disco, então fui remover e trocar uma unidade da matriz raid 1 mdadm.
Havia duas unidades na matriz assim:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 931.5G 0 disk
├─sda1 8:1 0 7.5G 0 part
│ └─md0 9:0 0 7.5G 0 raid1 [SWAP]
└─sda2 8:2 0 924.1G 0 part
└─md1 9:1 0 924G 0 raid1 /
sdb 8:16 0 931.5G 0 disk
├─sdb1 8:17 0 7.5G 0 part
│ └─md0 9:0 0 7.5G 0 raid1 [SWAP]
└─sdb2 8:18 0 924.1G 0 part
└─md1 9:1 0 924G 0 raid1 /
Eu não sabia qual disco seria defeituoso, então escolhi o sdb. Eu removi o sdb do md0 e md1 e reconstruí o array em um novo disco rígido durante a noite.
mdadm /dev/md0 --fail /dev/sdb1 --remove /dev/sdb1
mdadm /dev/md1 --fail /dev/sdb2 --remove /dev/sdb2
[substituir]
mdadm --add /dev/md0 /dev/sdb1
mdadm --add /dev/md1 /dev/sdb2
De manhã, verifica-se que a unidade defeituosa era sda e o servidor não pode mais inicializar.
EDIT: Devo salientar que a reconstrução falhou durante a noite e o novo disco não foi totalmente reconstruído.
Como posso configurar a unidade que tirei para que ela ainda faça parte da matriz mdadm? Eu tenho outro computador Linux na mão.
Tags hard-drive raid mdadm ubuntu