Como corrigir LSI MegaRaid RAID5 após 1 disco falhou

1

Meu LSI MegaRaid acabou de me dizer que um disco é "UBad", que eu suponho que ele falhou:

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:7    13 UBad   F 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -

Eu tenho um hot spare instalado:

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:6    14 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 D -

mas o status do hot spare não mudou. Está sendo usado para salvar minha matriz RAID?

Se não, como eu digo ao controlador para adicionar o hot spare ao grupo de disco 0?

    
por Aaron Digulla 26.12.2016 / 23:48

1 resposta

3

Primeiro, obtenha algumas informações sobre seu controlador, volumes e unidade:

storcli /c0 show all

/c0 é o controlador a verificar. Se não tiver certeza, tente /cALL e procure por uma linha como Controller = para obter os números do controlador.

Precisamos de EID e Slot / Slt da saída. Os TOPOLOGY ou PD LIST são bons:

TOPOLOGY :
========

---------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT     Size PDC  PI SED DS3  FSpace TR 
---------------------------------------------------------------------------
 0 -   -   -        -   RAID5 Optl  Y  8.185 TB dflt N  N   none N      N  
 0 0   -   -        -   RAID5 Optl  Y  8.185 TB dflt N  N   none N      N  
 0 0   0   252:0    10  DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   1   252:1    9   DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   2   252:2    11  DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   3   252:3    8   DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 -   -   252:7    13  DRIVE DHS   -  2.728 TB -    -  -   -    -      N  
 0 -   -   252:6    14  DRIVE DHS   -  2.728 TB -    -  -   -    -      N  
---------------------------------------------------------------------------
...
PD LIST :
=======
--------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:0    10 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68AX9N0 U  -    
252:1     9 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68AX9N0 U  -    
252:2    11 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:3     8 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:4    12 Onln   - 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:6    14 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:7    13 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
--------------------------------------------------------------------------------

Para fazer o controlador reconsiderar a unidade, defina-o como good :

storcli /c0 /e252 /s14 set good

/e252 é o gabinete ( EID na saída) e /s14 é o slot ( Slt na saída).

O estado do disco agora deve ser uGood :

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:7    13 uGood  F 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -

Se o controlador já conhecia o disco (ele foi instalado antes, mas por algum motivo, o controlador achou que o disco estava ruim), ele pode aparecer como DHS (hot spare dedicado).

Para verificar se o disco está OK, execute um autoteste:

smartctl -d megaraid,14  /dev/sdb -t long

14 é o DID (ID do Disco) do PD LIST ( storcli /c0 show all ). Esse é o disco que você quer. /dev/sdb é o dispositivo Linux que está conectado ao driver megaraid. -t long inicia um longo auto-teste.

Para encontrar o dispositivo Linux, use lsscsi :

 [6:2:0:0]    disk    LSI      MR9260-8i        2.13  /dev/sdb

Para verificar o estado do autoteste, use smartctl -d megaraid,14 /dev/sdb -c ou smartctl -d megaraid,14 /dev/sdb -a

    
por 28.12.2016 / 17:49

Tags