Sistema de arquivos configurado para o modo somente leitura, qual unidade está com defeito?

1

Eu acordei hoje para descobrir que o sistema de arquivos do meu servidor CentOS foi configurado para o modo somente leitura. Estou executando o RAID 1 neste servidor.

# mkdir test
mkdir: cannot create directory 'test': Read-only file system

Eu fiz algumas pesquisas e descobri que isso geralmente é causado por um problema de hardware, ou seja, o disco rígido está prestes a falhar.

Como descubro com certeza que é um problema de hardware e não um problema de software?

No caso de ser um problema de hardware: Como descubro qual das duas unidades está com defeito e precisa ser substituído? Smartctl mostra "PASSED" para os dois drives, embora um mostre 678 setores realocados e o outro mostre 33 setores realocados. (Novamente, estou usando o RAID 1)

saída do dmesg

ata2.00: exception Emask 0x0 SAct 0x4000000 SErr 0x0 action 0x0
ata2.00: irq_stat 0x40000008
ata2.00: failed command: READ FPDMA QUEUED
ata2.00: cmd 60/08:d0:58:11:38/00:00:01:00:00/40 tag 26 ncq 4096 in
         res 51/40:02:5e:11:38/00:00:01:00:00/40 Emask 0x409 (media error) <F>
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
sd 1:0:0:0: [sdb]
Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
sd 1:0:0:0: [sdb]
Sense Key : Medium Error [current] [descriptor]
Descriptor sense data with sense descriptors (in hex):
        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
        01 38 11 5e
sd 1:0:0:0: [sdb]
Add. Sense: Unrecovered read error - auto reallocate failed
sd 1:0:0:0: [sdb] CDB:
Read(16): 88 00 00 00 00 00 01 38 11 58 00 00 00 08 00 00
end_request: I/O error, dev sdb, sector 20451678
EXT3-fs error (device md2): ext3_get_inode_loc: unable to read inode block - inode=637820, block=2555947
ata2: EH complete
Aborting journal on device md2.
EXT3-fs (md2): error: ext3_journal_start_sb: Detected aborted journal
EXT3-fs (md2): error: remounting filesystem read-only
EXT3-fs (md2): error: remounting filesystem read-only
__journal_remove_journal_head: freeing b_committed_data
__journal_remove_journal_head: freeing b_frozen_data
__journal_remove_journal_head: freeing b_committed_data
ata2.00: exception Emask 0x0 SAct 0x1000006 SErr 0x0 action 0x0
ata2.00: irq_stat 0x40000008
ata2.00: failed command: READ FPDMA QUEUED
ata2.00: cmd 60/08:c0:58:11:38/00:00:01:00:00/40 tag 24 ncq 4096 in
         res 51/40:02:5e:11:38/00:00:01:00:00/40 Emask 0x409 (media error) <F>
ata2.00: status: { DRDY ERR }
ata2.00: error: { UNC }
ata2.00: configured for UDMA/133
sd 1:0:0:0: [sdb]
Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
sd 1:0:0:0: [sdb]
Sense Key : Medium Error [current] [descriptor]
Descriptor sense data with sense descriptors (in hex):
        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
        01 38 11 5e
sd 1:0:0:0: [sdb]
Add. Sense: Unrecovered read error - auto reallocate failed
sd 1:0:0:0: [sdb] CDB:
Read(16): 88 00 00 00 00 00 01 38 11 58 00 00 00 08 00 00
end_request: I/O error, dev sdb, sector 20451678
EXT3-fs error (device md2): ext3_get_inode_loc: unable to read inode block - inode=637807, block=2555947
ata2: EH complete
    
por Elite_Dragon1337 23.06.2017 / 17:19

1 resposta

0

Seu disco sdb está morrendo e Unrecovered read error - auto reallocate failed erro significa que não há possibilidade de realocar blocos defeituosos e o disco pode morrer a qualquer momento. Em nossos casos, o disco com tais erros em dmesg irá morrer no futuro próximo (um ou, no máximo, dois meses). Além disso, se seus discos estiverem crescendo em Reallocated_Sector_Ct no SMART, isso significa que seu disco está no estado de pré-alimentação e você deve avisar sobre a substituição.

    
por 23.06.2017 / 23:49