Como corrigir meu array raid10 quebrado

1

Eu tenho um RAID 10 que consiste em unidades de 4x3TB. Ela havia se degradado (o sdd havia caído). Eu pensei que tinha consertado e estava reconstruindo, mas agora (eu acho) sde parece estar causando problemas.

root@tower:~# mdadm -A --force /dev/md127 /dev/sd[b-e]
mdadm: /dev/md127 assembled from 2 drives and  1 rebuilding - not enough to start the array.

Isso é estranho - tudo que eu pesquisei sugere que eu deveria ver o nome do dispositivo / dev / md127 aqui, mas não:

root@tower:~# mdadm --examine --scan
ARRAY /dev/md/4x3TB metadata=1.2 UUID=acaef996:1ea7102b:9cd52d00:af0ef09e name=omv:4x3TB

Alguém pode recomendar um curso de ação adequado? Aqui está a saída de cada dispositivo:

/dev/sdb:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : acaef996:1ea7102b:9cd52d00:af0ef09e
           Name : omv:4x3TB
  Creation Time : Wed Dec 12 13:48:21 2012
     Raid Level : raid10
   Raid Devices : 4

 Avail Dev Size : 5860531120 (2794.52 GiB 3000.59 GB)
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 5860530176 (2794.52 GiB 3000.59 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 08ee73a5:86c62890:3dba03bb:522093e8

    Update Time : Sun Jun  7 17:44:09 2015
       Checksum : d282c882 - correct
         Events : 2589917

         Layout : near=2
     Chunk Size : 512K

   Device Role : Active device 0
   Array State : AA.? ('A' == active, '.' == missing)
/dev/sdc:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : acaef996:1ea7102b:9cd52d00:af0ef09e
           Name : omv:4x3TB
  Creation Time : Wed Dec 12 13:48:21 2012
     Raid Level : raid10
   Raid Devices : 4

 Avail Dev Size : 5860531120 (2794.52 GiB 3000.59 GB)
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 5860530176 (2794.52 GiB 3000.59 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : clean
    Device UUID : 05c34f6d:8bead38f:99a01f60:e6518283

    Update Time : Sun Jun  7 17:44:09 2015
       Checksum : da150f20 - correct
         Events : 2589917

         Layout : near=2
     Chunk Size : 512K

   Device Role : Active device 1
   Array State : AA.? ('A' == active, '.' == missing)
/dev/sdd:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x12
     Array UUID : acaef996:1ea7102b:9cd52d00:af0ef09e
           Name : omv:4x3TB
  Creation Time : Wed Dec 12 13:48:21 2012
     Raid Level : raid10
   Raid Devices : 4

 Avail Dev Size : 5860531120 (2794.52 GiB 3000.59 GB)
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 5860530176 (2794.52 GiB 3000.59 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
Recovery Offset : 670607488 sectors
          State : clean
    Device UUID : 6d632b5f:5a22a515:5c63d798:f1b590ef

    Update Time : Sun Jun  7 17:44:09 2015
       Checksum : 1e80b6bc - correct
         Events : 2589917

         Layout : near=2
     Chunk Size : 512K

   Device Role : Active device 3
   Array State : AA.? ('A' == active, '.' == missing)
/dev/sde:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : acaef996:1ea7102b:9cd52d00:af0ef09e
           Name : omv:4x3TB
  Creation Time : Wed Dec 12 13:48:21 2012
     Raid Level : raid10
   Raid Devices : 4

 Avail Dev Size : 5860531120 (2794.52 GiB 3000.59 GB)
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 5860530176 (2794.52 GiB 3000.59 GB)
    Data Offset : 2048 sectors
   Super Offset : 8 sectors
          State : active
    Device UUID : e6a95b56:6541b0e1:6f3b9ce7:a392ceb9

    Update Time : Sun Jun  7 14:06:33 2015
       Checksum : d2c1c56c - correct
         Events : 2589703

         Layout : near=2
     Chunk Size : 512K

   Device Role : Active device 3
   Array State : AA.A ('A' == active, '.' == missing)
cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md127 : inactive sdb[4](S) sdd[5](S) sdc[1](S)
      8790796680 blocks super 1.2

unused devices: 
    
por Rog 07.06.2015 / 21:59

2 respostas

0

Aviso de gordura grande:

Qualquer coisa que você fizer com sua matriz (incluindo coisas que sugiro) pode levar a uma perda de dados completa. Se houver um dado realmente não valioso (caro para recuperar), deixe alguém experiente lidar com a situação para você. Incluindo fazer cópias binárias de todas as quatro unidades.

Da sua saída, parece que você tem

   Device Role : Active device 3

duas vezes na sua saída --examine . Isso indicaria uma tentativa de recuperação, mas feita de maneira errada.

De /proc/mdstat parece que seu array é montado, mas não executado. Existem alguns números de dispositivos muito estranhos ( 4,5,1 ), enquanto suas unidades devem ser 0,1,2,3 . Isso também sugere que há discrepâncias nos metadados.

Outro ponto de interesse são os contadores Events nos metadados das unidades. Aqueles aggree para sd[b-d] , mas parece estar atrasado em sde . Tem certeza de que sdd foi a unidade que desistiu? Como isso preferiria apontar para sde estando fora da matriz por algum tempo.

Você pode tentar montar o array sem a unidade removida ( mdadm -A -R /dev/md127 /dev/sd[bcd] ou mdadm -A --force -R /dev/md127 /dev/sd[bce] ). Isso pode impedir o conflito. Se isso funcionar, e mesmo que funcione, não escreva nada na matriz, faça backup dos dados e tente adicionar sdd como hot spare.

Se isso não funcionar, você pode tentar atualizar sua pergunta com a saída de mdadm -D /dev/md127 após montar o array (ambas as formas sugeridas atualmente).

    
por 08.06.2015 / 00:33
0

Parece que você perdeu todo um subarray do seu Raid10 (Drives sdd, sde era um espelho antes ?!) - se esse seria o caso, seus dados se perderiam.

    
por 07.06.2015 / 22:17