Como faço para reinicializar uma unidade RAID 5 com falha usando o terminal no Ubuntu Server

0

Eu atualmente montei um novo sistema e parte disso tem criado um software RAID 5 usando 'mdadm' no Ubuntu Server.

Eu cheguei ao ponto de criar o array usando:

sudo mdadm --create --verbose /dev/md0 --level=5 --raid-devices=4 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

Eu deixei para fazer a coisa dele durante a noite e usei o seguinte comando para verificar:

watch cat /proc/mdstat

Para o qual o seguinte foi retornado:

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid5 sdd1[4](S) sdc1[2] sdb1[1] sda1[0](F)
      5860535808 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/2] [_UU_]

unused devices: <none>

Parece que um deles falhou (e não sou muito perspicaz com o motivo de outro ser um sobressalente).

Então, só para ter certeza de que algo não está errado, tentei reativar a unidade com falha. Alguém pode explicar como posso fazer isso e o que devo fazer com o sobressalente (se houver).

E também como sei quando a sincronização está concluída?

O tutorial que eu usei para chegar até aqui está localizado aqui:

link

Muito obrigado!

p.s. Aqui estão algumas informações extras que podem ajudar:

sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 1.2
  Creation Time : Mon Jun 18 21:14:21 2012
     Raid Level : raid5
     Array Size : 5860535808 (5589.04 GiB 6001.19 GB)
  Used Dev Size : 1953511936 (1863.01 GiB 2000.40 GB)
   Raid Devices : 4
  Total Devices : 4
    Persistence : Superblock is persistent

    Update Time : Mon Jun 18 21:50:26 2012
          State : clean, FAILED 
 Active Devices : 2
Working Devices : 3
 Failed Devices : 1
  Spare Devices : 1

         Layout : left-symmetric
     Chunk Size : 512K

           Name : myraidbox:0  (local to host myraidbox)
           UUID : a269ee94:a161600c:fb1665e7:bd2f27b3
         Events : 13

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       17        1      active sync   /dev/sdb1
       2       8       33        2      active sync   /dev/sdc1
       3       0        0        3      removed

       0       8        1        -      faulty spare   /dev/sda1
       4       8       49        -      spare   /dev/sdd1
    
por Stephen 19.06.2012 / 09:12

1 resposta

0

Por alguma razão, o mdadm decidiu que o sda1 está com defeito e o sdd1 deve ser removido. Verifique /var/log/syslog para mensagens de erros mdadm ou ATA / SCSI para tentar encontrar o motivo. Pode haver algo errado com suas unidades ou controladores.

Para recuperar a matriz, você precisa adicionar novamente as unidades com falha. Espera-se que o mdadm reconheça as unidades como sendo anteriormente parte da matriz e tendo dados válidos. Eu tentaria o seguinte com sda1 primeiro e, em seguida, sdd1.

mdadm /dev/md0 --re-add /dev/sda1

Se ele reclamar que o sda1 já faz parte do array, remova-o primeiro e, em seguida, adicione-o novamente. Verifique a saída de mdadm --detail antes de continuar com a próxima unidade.

    
por 19.06.2012 / 09:39