RAID ressincronizando automaticamente?

6

Eu verifiquei aleatoriamente o status dos meus arrays RAID com cat/proc/mdstat e percebi que um dos meus arrays parece estar ressincronizando:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Por que isso e o que isso significa? Eu aparentemente posso acessar o ponto de montagem muito bem com r/w permissões.

EDIT 1 (em resposta a RESPOSTA do SLM )

Eu realmente não consigo ver nada se eu grep a dmesg e a --detail não me dizem muito, ou seja, ele mostra que a ressincronização está em andamento ... mas nenhuma dica para o razão ou porque pode ter ficado fora de sincronia ... - Acho que só preciso ficar de olho nele antes de começar a trocar meu hardware.

    
por cerr 02.09.2014 / 04:46

3 respostas

7

Isso parece indicar que a sincronização entre os dois membros do RAID não está em sincronia um com o outro.

1. Investigue logs

Eu investigaria seus dmesg logs e veria se há alguma mensagem informando que os HDDs físicos que compõem esse array estão tendo falhas de hardware.

2. Verifique o mdadm

Você também pode consultar mdadm usando a opção --detail para descobrir mais informações sobre a ressincronização da seguinte forma:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Se ambos os dispositivos parecerem perfeitos e você não puder identificar qual dispositivo está tendo um problema, talvez queira executar temporariamente uma ferramenta de diagnóstico, como HDAT2 ou SpinRite, em cada HDD para confirmar sua saúde.

3. Cabeamento

Se os HDDs fizerem o check-out, eu começaria a examinar o cabeamento, eu normalmente os trocarei.

4. Controlador

Em seguida, examinarei o controlador em si, removendo as unidades do sistema afetado e diagnosticando-as em um sistema secundário ou adicionando uma placa controladora de terceiros ao sistema afetado para diagnosticar o problema ainda mais.

5. Fonte de alimentação

Acredite ou não, eu tive problemas no passado com HDDs e RAIDs em que trocar uma fonte de alimentação defeituosa ou prestes a falhar resolvia meus problemas de integridade de RAID.

    
por 02.09.2014 / 05:02
5

Verifique seus arquivos cron, muitas distribuições fazem uma nova sincronização / verificação novamente uma vez por semana.

No CentOS 7.1, está em /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Para configurar o comportamento, edite / etc / sysconfig / raid-check

    
por 02.03.2015 / 17:48
1

No Debian é feito a partir de:

/etc/cron.d/mdadm

Para desativar:

chmod -x /usr/share/mdadm/checkarray

Veja também.

    
por 29.05.2017 / 03:38