Falha de disco do software RAID 5

2

Eu vou precisar de alguma ajuda especializada - cerveja / café grátis para qualquer um que me pegar no meu caminho!

Meu sistema Estou executando o Ubuntu 11.10 com uma configuração de 3 discos RAID 5, com discos rígidos de 3TB, no formato ext4.

O que eu fiz Eu recentemente revi a saúde dos discos no Disk Utility, e vi que duas das minhas unidades tinham setores defeituosos. Tudo estava funcionando bem, mas fiquei um pouco preocupado. Quando olhei para o detalhe do mdadm, vi que uma das unidades estava em falha e a invasão estava degradada. No entanto, uma das unidades com alguns setores com falha não estava relatando uma falha do mdadm.

Comprei um novo disco rígido e segui as etapas para substituir uma unidade com falha em uma configuração de software RAID 5. (Marquei a unidade como falhada, removi-a, desliguei o computador, substituí-a, particionei a nova unidade e a adicionei de volta ao RAID). O processo quase terminou (eu acho), mas quando revi os detalhes do mdstat novamente, as coisas pareciam muito piores do que eram antes.

O que eu tenho agora

Aqui está a saída do mdstat --detail / dev / mda127

root@mediapc:/home/jason# mdadm --detail /dev/md127 
/dev/md127:
        Version : 1.2
  Creation Time : Sun Mar 10 08:57:16 2013
     Raid Level : raid5
     Array Size : 5860530176 (5589.04 GiB 6001.18 GB)
  Used Dev Size : 2930265088 (2794.52 GiB 3000.59 GB)
   Raid Devices : 3
  Total Devices : 3
    Persistence : Superblock is persistent

Update Time : Sun Mar 16 06:48:06 2014
      State : clean, FAILED
Active Devices : 1
Working Devices : 2
Failed Devices : 1
Spare Devices : 1

     Layout : left-symmetric
 Chunk Size : 512K

       Name : mediapc:127  (local to host mediapc)
       UUID : ffbed825:f397afb1:86535cd8:64f8c314
     Events : 373600

Number   Major   Minor   RaidDevice State
   0       8        1        0      active sync   /dev/sda1
   1       0        0        1      removed
   2       0        0        2      removed

   3       8       32        -      faulty spare   /dev/sdc
   4       8       17        -      spare   /dev/sdb1

Minha unidade recém-adicionada (dev / sdb1) foi adicionada como sobressalente. A partição que estava relatando alguns problemas de setor (no Utilitário de Disco), mas que estava funcionando bem no RAID, agora está relatando como uma reserva defeituosa.

Tenho certeza de que todos / a maioria dos dados ainda estão presentes, não tenho como chegar até eles. Comprarei mais unidades (externas) se alguém tiver uma ideia sobre como recuperar meus dados ou como recuperar meu RAID, se possível.

Eu queria tentar consertar os setores na unidade sobressalente agora defeituosa (/ dev / sdc), mas o fsck falha de duas maneiras diferentes:

root@mediapc:/home/jason# fsck /dev/sdc
fsck from util-linux 2.19.1
fsck: fsck.linux_raid_member: not found
fsck: Error 2 while executing fsck.linux_raid_member for /dev/sdc

OR:

root@mediapc:/home/jason# fsck /dev/sdc1
fsck from util-linux 2.19.1
e2fsck 1.41.14 (22-Dec-2010)
fsck.ext4: Device or resource busy while trying to open /dev/sdc1
Filesystem mounted or opened exclusively by another program?

Eu tentei adicionar as duas unidades de volta ao array como elas são, mas as duas não adicionam:

root@mediapc:/home/jason# mdadm --add /dev/md127 /dev/sdb1
mdadm: Cannot open /dev/sdb1: Device or resource busy

Eu tentei pesquisar a maneira de executar o fsck, mas não queria reinicializar o sistema até ter certeza de que esse seria o próximo movimento correto.

Realmente procurando por alguma ajuda especializada. Eu quero meus dados, e eu quero que este RAID 5 funcione - mas acima de tudo eu gostaria dos dados. Agradeço antecipadamente. Deixe-me saber se há mais alguma coisa que eu possa fornecer.

Atenciosamente, Jason

    
por user258779 16.03.2014 / 12:36

1 resposta

0

Você precisará umount da matriz RAID antes de poder executar fsck em qualquer um dos dispositivos que fazem parte dela.

Eu realmente espero que você tenha um backup, porque parece que você está indo para um acidente. Tentar recuperar de uma única falha de disco aumenta a chance de outros discos na matriz falharem também devido ao fato de que a carga sobre eles aumenta durante o reparo. (ref: link )

    
por Mausy5043 16.03.2014 / 13:23