Mdadm raid1 diz que a última unidade conectada falhou

2

Eu tenho um array RAID1 de software. Hoje eu encontrei uma das unidades não conseguiu sincronizar, e eu tenho isso:

 $ cat /proc/mdstat 
Personalities : [raid1] 

md0 : active raid1 sdb1[0] sda1[2](F)
      153597312 blocks [2/1] [U_]

Então eu fiz:

  mdadm --manage /dev/md0 --remove /dev/sda1
  mdadm --manage /dev/md0 --add /dev/sda1

Os dispositivos sincronizaram cerca de 25% do caminho da AFAIK e, em seguida, acabei com o mdadm acalmando a unidade que estava ok e agora falhou:

# cat /proc/mdstat 
Personalities : [raid1] 

md0 : active raid1 sda1[1] sdb1[2](F)
      153597312 blocks [2/1] [_U]

Agora estou com medo de recolocar e causar perda de dados.

  1. O que está acontecendo?
  2. Existe uma maneira de testar os dados da matriz ok?
  3. O que devo fazer agora?

Obrigado Guy

    
por GuySoft 03.01.2016 / 16:33

1 resposta

3

O que eu faria nesse cenário é primeiro criar um novo RAID-1 a partir de dois (ou três) novos discos para usar durante o processo de recuperação. O RAID existente é de apenas cerca de 150 GB e os discos de 1 TB não são caros, por isso, um novo RAID-1 de dois discos de 1 TB será útil durante o processo de recuperação.

Quando estiver pronto, recupere o máximo de setores possível de cada um dos discos defeituosos em arquivos no seu novo RAID-1. Este é o estágio mais crítico do processo de recuperação. Qualquer erro até a conclusão deste estágio pode tornar seu problema pior do que é atualmente.

A julgar pelo comportamento que você teve, é provável que nenhum disco tenha uma falha completa, mas cada um deles tem setores ilegíveis.

Com um pouco de sorte, você poderá obter uma cópia de cada setor de pelo menos uma das duas unidades. Depois de ultrapassar esse estágio, você pode deixar as unidades problemáticas de lado e trabalhar com os dados recuperados nas novas unidades, com pouco risco de piorar a situação.

É provável que os dados nas duas unidades estejam um pouco fora de sincronia. Devido à falha na tentativa de recuperação, você não pode ter certeza absoluta de qual está mais atualizado. E mesmo que você soubesse, provavelmente veria alguns setores em que a versão mais atualizada foi perdida e você seria forçado a usar a versão menos atualizada.

Isso deixa você com um pouco de quebra-cabeça para descobrir exatamente o que pode ser recuperado. Mas essa parte do processo de recuperação não é muito arriscada se você souber o que está fazendo.

    
por 03.01.2016 / 17:01