Algo errado com o software Linux RAID1

Question

Algo errado com o software Linux RAID1

#1 resposta do (2 votos)
#2 resposta do (1 votos)

2

Eu tenho um software RAID1 e agora toda semana o Linux sincroniza meu volume raid.

Eu verifiquei cat /proc/mdstat :

 *Personalities : [raid1] 
       md3 : active raid1 sda5[0] sdb5[1]
             1822445428 blocks super 1.0 [2/2] [UU]

       md1 : active raid1 sdb2[1] sda2[0]
             524276 blocks super 1.0 [2/2] [UU]

       md2 : active raid1 sda3[0] sdb3[1]
             1073741688 blocks super 1.0 [2/2] [UU]
             [============>........]  check = 61.9% (665688192/1073741688) finish=203.8min speed=33367K/sec

       md0 : active raid1 sda1[0] sdb1[1]
             33553336 blocks super 1.0 [2/2] [UU]

       unused devices: <none>*

Parece normal. Mas eu verifiquei / log / messages e encontrei:

41/40:80:20:48:c3/00:00:04:00:00/00 Emask 0x409 (media error) <F>
May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: status: { DRDY ERR }
May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: error: { UNC }
May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: configured for UDMA/133
May 26 10:45:45 CentOS-62-64-minimal kernel: ata2: EH complete
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: irq_stat 0x40000008
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: failed command: READ FPDMA QUEUED
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: cmd 60/80:00:00:48:c3/00:00:04:00:00/40 tag 0 ncq 65536 in
May 26 10:45:48 CentOS-62-64-minimal kernel:         res 41/40:80:20:48:c3/00:00:04:00:00/00 Emask 0x409 (media error) <F>
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: status: { DRDY ERR }
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: error: { UNC }
May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: configured for UDMA/133
May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Unhandled sense code
May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Sense Key : Medium Error [current] [descriptor]

Qualquer ajuda com isso? O que pode ser e o que preciso fazer?

linux raid1

por webgeek 26.05.2013 / 16:11

2 respostas

Tags linux raid1

Freqeunt Falha Auditar erros no servidor web (MSSQLSERVER) MDT 2012 - KeyboardLocale, SkipTimeZone não funciona

score 2 · Answer 1

Geralmente, esses erros significam que a unidade (/ dev / sdb no seu caso) pode estar falhando em breve.

Você pode usar o smartctl para fazer um S.M.A.R.T. autoteste para ver se algum erro aparece.

Você pode fazer uma verificação estendida executando

smartctl -t long /dev/sdb

Você pode ver os resultados (e muito mais informações também) executando

smartctl -a /dev/sdb

Procure também os valores Relocated_Sector_Ct e Offline_Uncorrectable . Eles devem ser 0. Se o Relocated_Sector_Ct for > 0 significa que a unidade já realocou alguns setores difíceis de ler para a área sobressalente da unidade (é um comportamento normal - mas indica que em breve a unidade pode falhar). Se o Offline_Uncorrectable for > 0 significa então que a unidade está falhando.

Por favor, poste os resultados de smartctl -a /dev/sdb .

Se o smartctl não estiver instalado, você poderá instalá-lo executando

yum install smartmontools -y

Esses erros também podem ser causados por uma fonte de alimentação defeituosa do inversor ou por um cabo SATA defeituoso.

score 1 · Answer 2

Parece que sua unidade sdb está falhando. Substitua antes que seja tarde demais. Você pode tentar usar ferramentas SMART para confirmar esse diagnóstico, com um comando como:

sudo smartctl -q errorsonly -H -l selftest /dev/hda