Configuração do software RAID 1

0

Eu criei um software RAID 1 há algum tempo e ele sempre pareceu funcionar para mim. No entanto, não tenho certeza absoluta de que configurei tudo corretamente e não tenho a experiência para verificar, por isso ficaria muito grato por algum conselho ou apenas pela verificação de que tudo parece certo até agora.

Estou usando o Linux Fedora 20 (32 bits com planos de atualização para 64 bits) O RAID 1 deve consistir em dois discos rígidos SATA de 1TB.

Esta é a saída de mdadm --detail /dev/md0

/dev/md0:
        Version : 1.2
  Creation Time : Sun Jan 29 11:25:18 2012
     Raid Level : raid1
     Array Size : 976761424 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976761424 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

    Update Time : Sat Jun  7 10:38:09 2014
          State : clean, degraded 
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : argo:0  (local to host argo)
           UUID : 1596d0a1:5806e590:c56d0b27:765e3220
         Events : 996387

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8        0        1      active sync   /dev/sda

O RAID é montado com sucesso:

friedrich@argo:~ ➤ sudo mount -l | grep md0
/dev/md0 on /mnt/raid type ext4 (rw,relatime,data=ordered)

Basicamente, minha pergunta é:

  • Por que tenho apenas 1 dispositivo ativo?
  • O que significa o Estado removed no final?

Também notei algumas mensagens de erro estranhas que vejo no console no início e no desligamento do sistema e sempre repetindo em segundo plano quando eu alterno com Ctrl + Alt + F2:

...
ata2: irq_stat 0x00000040 connection status changed
ata2: SError: { CommWake DevExch }
ata2: COMRESET failed (errno=-32)
ata2: exception Emask 0x10 SAct 0x0 SErr 0x4040000 action 0xe frozen
ata2: irq_stat 0x00000040 connection status changed
ata2: SError: { CommWake DevExch }
ata2: exception Emask 0x10 SAct 0x0 SErr 0x4040000 action 0xe frozen
...

Esses erros estão relacionados ao RAID? Algo parece errado com os dispositivos SATA .. Todos juntos o sistema funciona (eu posso ler e escrever para o ataque montado), mas eu sempre tive esses erros estranhos no desligamento de inicialização (provavelmente sempre em segundo plano).

Thx pela sua ajuda

    
por Friedrich Große 07.06.2014 / 11:14

1 resposta

0

Parece que um dos discos foi retirado do array. Isso é indicado primeiro pelo estado removed que você já notou e, em seguida, pela seguinte linha:

State : clean, degraded

Aqui está o que eu faria se tivesse o mesmo problema:

  • Verifique cuidadosamente dmesg por qualquer motivo pelo qual o disco foi retirado do array. Você pode tentar com dmesg | grep md: e dmesg | grep sdb (suponho que o disco que está faltando seja sdb) e veja se há erros registrados. Eu acho que o que aconteceu é que sua unidade foi desconectada em algum momento e foi descartada da matriz. Ele poderia ter sido descartado devido a qualquer motivo, como cabos defeituosos, ou controlador de disco quebrado ou outro.

  • Identifique a letra da unidade que foi excluída da matriz e verifique com o smartctl se há algum problema: smartctl -a /dev/disk0 . Procure possíveis erros em WHEN_FAILED e START OF READ SMART DATA SECTION .

  • Se o disco ficar saudável (sem erros indicados por), você poderá adicioná-lo novamente à sua matriz: %código%. Você pode monitorar o progresso da reconstrução executando mdadm -a /dev/md0 /dev/sdb .

Claro, eu aconselho você a fazer backup de seus dados antes de fazer qualquer dessas coisas, já que a execução de comandos errados pode deixá-lo sem seus dados!

    
por 09.06.2014 / 20:39