LSI MegaRAID SAS 9261-8i: o disco não é reconhecido após a substituição

1

Eu tenho um servidor Supermicro com um controlador RAID MegaRAID SAS 9261-8i dentro. Havia 3 discos anexados ao controlador que foram configurados como matriz RAID5. Um dos discos falhou recentemente (o RAID foi exibido como degradado) e depois de verificar as informações do S.M.A.R.T, ele teve que ser substituído.

Marquei a unidade como ausente usando storcli e removi a unidade para envio ao fornecedor. Agora a substituição do disco chegou, liguei-o ao controlador RAID mas nada aconteceu. Isto é o que storcli diz:

storcli /c0 show

TOPOLOGY :
========

------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT     Size PDC  PI SED DS3  FSpace 
------------------------------------------------------------------------
 0 -   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
 0 0   -   -        -   RAID5 Dgrd  N  5.456 TB dflt N  N   none Y      
 0 0   0   -        -   DRIVE Msng  -  2.728 TB -    -  -   -    -      
 0 0   1   252:5    14  DRIVE Onln  N  2.728 TB dflt N  N   none -      
 0 0   2   252:2    11  DRIVE Onln  N  2.728 TB dflt N  N   none -      
------------------------------------------------------------------------

Como você pode ver, as duas unidades no Slot 2 e 5 estão on-line e outra unidade do Grupo de Dispositivos (DG) está marcada como ausente. A terceira unidade costumava estar no Slot 0 enquanto a substituição está agora no Slot 1. Mas a nova unidade não é reconhecida pelo controlador, como você também pode ver na lista de dispositivos Phsical (saída do mesmo comando acima):

Physical Drives = 2

PD LIST :
=======

-----------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                  Sp 
-----------------------------------------------------------------------------
252:2    11 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
252:5    14 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD3000FYYZ-01UL1B0 U  
-----------------------------------------------------------------------------

Em contraste, veja a seguinte saída:

storcli /c0/pall show

PhyInfo :
=======

----------------------------------------------------------------------------
PhyNo SAS_Addr           Phy_Identifier Link_Speed Device_Type  Description 
----------------------------------------------------------------------------
    0 0x0000000000000000              0 No limit   -            -           
    1 0x4433221101000000              0 No limit   End Device   -           
    2 0x0000000000000000              0 No limit   -            -           
    3 0x0000000000000000              0 No limit   -            -           
    4 0x4433221104000000              0 No limit   End Device   -           
    5 0x0000000000000000              0 No limit   -            -           
    6 0x4433221106000000              0 No limit   End Device   -           
    7 0x0000000000000000              0 No limit   -            -           
----------------------------------------------------------------------------

Eu acho que PhyNo 1 é a unidade substituída, mas este é o único comando onde posso encontrar um rastreio dela. Todos os comandos específicos do Slot para Slot 1 terminam com Drive not found .

Alguma ideia sobre isso? Eu testei a unidade substituída em um segundo servidor que é exatamente a mesma configuração (também o mesmo RAID Controller), onde o controlador detecta a unidade imediatamente marcada como UGood , o que significa Unconfigured Good , por isso não poderia ser um erro de unidade . Eu também fiz algumas reinicializações, desliguei por alguns minutos e tentei usar o BIOS LSI MegaRaid durante a inicialização para detectar a nova unidade, sem sucesso. A unidade não aparece na mensagem de inicialização do BIOS do LSI MegaRaid.

Quaisquer sugestões seriam muito apreciadas.

    
por morten.c 10.04.2014 / 00:22

1 resposta

1

Acontece que esse comportamento foi causado por um HDD faminto - que foi substituído. Eu não entendi porque o segundo servidor reconheceu o novo disco rígido sem problemas, mas talvez esse tenha sido o último suspiro desse disco rígido virgem.

Eu não esperava um defeito na chegada por HDDs de data center (série WD RE, antes que você pergunte), eu estarei ciente disso no futuro, antes de perder horas de meu tempo.

    
por 17.04.2014 / 01:27