Cada reinicialização no meu servidor resulta em uma interrupção devido a uma matriz RAID5 (software) degradada. A mesma unidade /dev/sdc
parece estar saindo de cada vez. Eu ignoro e inicializo com uma matriz degradada de qualquer maneira. Para obter o array reconstruindo novamente com o drive, eu emito o comando:
sudo mdadm /dev/md0 --add /dev/sdc
e com isso eu posso ver:
cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid5 sdc[4] sdd[3] sdb[1]
2930014752 blocks super 1.2 level 5, 4k chunk, algorithm 2 [3/2] [_UU]
[====>................] recovery = 24.8% (363686144/1465007376) finish=213.2min speed=86050K/sec
unused devices: <none>
Durante o processo de reconstrução, posso ver que o URAID de ARRAY é diferente na unidade /dev/sdc
e a terceira partição da unidade não está listada:
sudo mdadm --examine /dev/sd[bcd]1 | egrep 'UUID|dev'
/dev/sdb1:
Array UUID : 1a000a97:9257df81:4a6ccde8:c6b9b3f5
Device UUID : f7dd3752:8e28c48e:ae389924:9f42b503
Device Role : Active device 1
/dev/sdd1:
Array UUID : 1a000a97:9257df81:4a6ccde8:c6b9b3f5
Device UUID : 63031869:ecade3ac:2738fbdf:3f1af144
Device Role : Active device 2
A terceira unidade está listada aqui,
sudo mdadm --examine /dev/sd[bcd] | egrep 'UUID|dev'
/dev/sdb:
Array UUID : 4918dc9c:b21aa70f:21db4067:388cc3a3
Device UUID : 5f9355e9:c370e7e2:fb03fe3d:969fda6e
Device Role : Active device 1
/dev/sdc:
Array UUID : 4918dc9c:b21aa70f:21db4067:388cc3a3
Device UUID : 10f27f1c:7c00915a:cb1a9c17:e3722644
Device Role : Active device 0
/dev/sdd:
Array UUID : 4918dc9c:b21aa70f:21db4067:388cc3a3
Device UUID : 16879ff2:02f73bc3:d2bd7b04:86fd8098
Device Role : Active device 2
Também notei que o URAID de ARRAY de /dev/sdc
é igual ao que está em /etc/mdadm/mdadm.conf
grep ARRAY /etc/mdadm/mdadm.conf
ARRAY /dev/md/0 metadata=1.2 UUID=4918dc9c:b21aa70f:21db4067:388cc3a3 name=ubuntu-nas:0
sudo mdadm --detail --scan
ARRAY /dev/md/0 metadata=1.2 spares=1 name=ubuntu-nas:0 UUID=4918dc9c:b21aa70f:21db4067:388cc3a3
sudo blkid
retorna o UUID das outras duas unidades na matriz como o mesmo UUID:
sudo blkid
/dev/sdd1: UUID="1a000a97-9257-df81-4a6c-cde8c6b9b3f5" UUID_SUB="63031869-ecad-e3ac-2738-fbdf3f1af144" LABEL="ubuntu-nas:0" TYPE="linux_raid_member"
/dev/sdb1: UUID="1a000a97-9257-df81-4a6c-cde8c6b9b3f5" UUID_SUB="f7dd3752-8e28-c48e-ae38-99249f42b503" LABEL="ubuntu-nas:0" TYPE="linux_raid_member"
/dev/sdc: UUID="4918dc9c-b21a-a70f-21db-4067388cc3a3" UUID_SUB="cb23ee6c-3bd6-7ade-272c-b3808162cbd0" LABEL="ubuntu-nas:0" TYPE="linux_raid_member"
/dev/md0: UUID="6a5fffe8-aba0-4ee2-b74b-20f7d735eedd" TYPE="ext4"
Há algo de errado com o meu UUID do ARRAY? Por que o ARRAY UUID da unidade removida é exibido como o que está em /etc/mdadm/mdadm.conf
? O que deve dizer o UUID do meu array para todos os meus drives? O que devo colocar no /etc/fstab
?
grep /dev/md0 /etc/fstab
/dev/md0 /media/nas/ ext4 defaults,noatime,nobootwait 0 2
Eu também descobri que o array pode ter sido montado incorretamente. Meus dados estão lá e posso acessá-los, mas quando executo sudo mdadm --examine --scan -v
, mostro dois arrays diferentes com os mesmos UUIDs /dev/md/0
e differnt. Parece que uma matriz é criada com o disco inteiro e a outra é com as partições. Como faço para corrigir isso sem perder meus dados?
sudo mdadm --examine --scan -v
ARRAY /dev/md/0 level=raid5 metadata=1.2 num-devices=3 UUID=4918dc9c:b21aa70f:21db4067:388cc3a3 name=ubuntu-nas:0
devices=/dev/sdd,/dev/sdc,/dev/sdb
ARRAY /dev/md/0 level=raid5 metadata=1.2 num-devices=3 UUID=1a000a97:9257df81:4a6ccde8:c6b9b3f5 name=ubuntu-nas:0
devices=/dev/sdd1,/dev/sdb1