Bad Blocks existe no dispositivo virtual PERC H700 Integrated

2

Eu tenho um servidor DELL com controlador integrado PERC H700. Eu criei o RAID5 com 12 discos rígidos e o dispositivo virtual está no estado Optimal, mas recebo esses erros no linux:

sd 0:2:0:0: [sda] Unhandled error code
sd 0:2:0:0: [sda]  Result: hostbyte=0x07 driverbyte=0x00
sd 0:2:0:0: [sda] CDB: cdb[0]=0x88: 88 00 00 00 00 07 22 50 bd 98 00 00 00 08 00 00
end_request: I/O error, dev sda, sector 30640487832
sd 0:2:0:0: [sda] Unhandled error code
sd 0:2:0:0: [sda]  Result: hostbyte=0x07 driverbyte=0x00
sd 0:2:0:0: [sda] CDB: cdb[0]=0x88: 88 00 00 00 00 07 22 50 bd 98 00 00 00 08 00 00
end_request: I/O error, dev sda, sector 30640487832
sd 0:2:0:0: [sda] Unhandled error code
sd 0:2:0:0: [sda]  Result: hostbyte=0x07 driverbyte=0x00
sd 0:2:0:0: [sda] CDB: cdb[0]=0x88: 88 00 00 00 00 07 22 50 bc e0 00 00 01 00 00 00
end_request: I/O error, dev sda, sector 30640487648

Mas todos os discos estão no estado Firmware: Online, Spun Up.
Também não há um único erro de leitura ou gravação da ATA em qualquer disco na raid (eu os verifico com smartctl -a -d sat+megaraid,N -H /dev/sda ). A única coisa estranha é na saída em

megacli:
megacli -LDInfo -L0 -a0
...
Bad Blocks Exist: Yes

Como poderia haver blocos ruins em uma unidade virtual, que está no estado ideal e nenhum disco está quebrado ou mesmo com um único erro? Eu tentei "Verificação de Consistência", mas terminou com sucesso e os erros ainda estão no dmesg. Alguém poderia me ajudar a descobrir o que há de errado com o meu ataque?

    
por neoX 22.10.2012 / 17:56

2 respostas

2

O indicador "Bad blocks exists" da MegaCLI refere-se à tabela Soft Bad Block Management que funciona da seguinte forma (citação do MegaRaid docs ):

If the CU detects a media error on the source drive during rebuild, it initiates a sector read for that block. If the sector read fails, the CU adds entries to the Soft Bad Block Management (SBBM) table, writes this table to the target drive, and displays an error message.

Additional error messages are displayed if the SBBM table is 80% full or 100% full. If the SBBM table is completely full, the rebuild operation is aborted, and the drive is marked as FAIL.

A tabela SBBM não conteria as mesmas marcações "ruins" do que é relatado pela SMART, pois os critérios e métodos de ação são muito diferentes.

Veja quais dos seus drives estão relatando erros usando megacli -LDPDInfo -aAll e faça um exame mais detalhado.

    
por 22.10.2012 / 18:30
0

Eu recebi esse problema recentemente. Havia a mensagem 'Bad Blocks Exist: Yes' no array, mas todos os LD e PD estavam bem. Houve erros na leitura dessa matriz.

Eu encontrei o comando -LDBBMClr , que limpa a tabela fkng.

megacli -LDBBMClr -L0 -a0 (mude o número de acordo com o seu adaptador / array)

Por favor, não se esqueça de remontar o sistema de arquivos (ou reiniciar), pois erros de leitura anteriores podem causar alguns problemas mais tarde.

    
por 16.06.2017 / 15:59