Adaptec RAID Controler - Dispositivo lógico em estado com falha

2

Eu tenho um controlador RAID Adaptec ASR8405 de hardware no qual eu tenho 15 disco RAID6 Array. Um dos discos quebrou e após a substituição o Controlador não atendeu, não iniciou a reconstrução, mas entrou no estado Falha (veja abaixo):

----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical Device number 0
   Logical Device name                      : LogicalDrv 0
   Block Size of member drives              : 512 Bytes
   RAID level                               : 6 Reed-Solomon
   Unique Identifier                        : A0E20532
   Status of Logical Device                 : Failed
   Additional details                       : Initialized with Build/Clear
   Size                                     : 74347510 MB
   Parity space                             : 11438080 MB
   Stripe-unit size                         : 256 KB
   Interface Type                           : Serial ATA
   Device Type                              : HDD
   Read-cache setting                       : Enabled
   Read-cache status                        : On
   Write-cache setting                      : Enabled
   Write-cache status                       : Off
   Partitioned                              : No
   Protected by Hot-Spare                   : No
   Bootable                                 : Yes
   Failed stripes                           : No
   Power settings                           : Disabled
   --------------------------------------------------------
   Logical Device segment information
   --------------------------------------------------------
   Segment 0                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:0) K1JG4N8D
   Segment 1                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:1) K1JGHL7D
   Segment 2                                : Missing
   Segment 3                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:3) K1JGE6ZD
   Segment 4                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:4) K1JEWTND
   Segment 5                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:5) K1JENR3D
   Segment 6                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:6) K1JG2U0D
   Segment 7                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:7) K1JG66ED
   Segment 8                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:8) K1JGHJ6D
   Segment 9                                : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:9) K1JGELLD
   Segment 10                               : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:10) K1JG5XYD
   Segment 11                               : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:11) K1JGSTJD
   Segment 12                               : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:12) K1JG339D
   Segment 13                               : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:13) K1JG16KD
   Segment 14                               : Present (5723166MB, SATA, HDD, Enclosure:0, Slot:14) K1JEX09D

Como você pode ver, o disco no segmento 2 do dispositivo lógico é relatado como ausente, mas aparece na verificação de dispositivos físicos (com estado pronto):

  Device #2
     Device is a Hard drive
     State                              : Ready
     Block Size                         : 512 Bytes
     Supported                          : Yes
     Programmed Max Speed               : SATA 6.0 Gb/s
     Transfer Speed                     : SATA 12.0 Gb/s
     Reported Channel,Device(T:L)       : 0,6(6:0)
     Reported Location                  : Enclosure 0, Slot 2(Connector 0)
     Reported ESD(T:L)                  : 2,0(0:0)
     Vendor                             : ATA
     Model                              : HGST HUS726060AL
     Firmware                           : T907
     Serial number                      : K1GVY99D
     World-wide name                    : 5000CCA255CC3FA3
     Reserved Size                      : 4225560 KB
     Used Size                          : 0 MB
     Unused Size                        : 5719040 MB
     Total Size                         : 5723166 MB
     Write Cache                        : Enabled (write-back)
     FRU                                : None
     S.M.A.R.T.                         : No
     S.M.A.R.T. warnings                : 0
     Power State                        : Full rpm
     Supported Power States             : Full rpm,Powered off,Reduced rpm
     SSD                                : No
     Temperature                        : 42 C/ 107 F
     NCQ status                         : Enabled
  ----------------------------------------------------------------
  Device Phy Information
  ----------------------------------------------------------------
     Phy #0
        PHY Identifier                  : 0
        SAS Address                     : 50000D1701875C02
        Attached PHY Identifier         : 2
        Attached SAS Address            : 50000D1701875C3F
  ----------------------------------------------------------------
  Runtime Error Counters
  ----------------------------------------------------------------
     Hardware Error Count               : 0
     Medium Error Count                 : 0
     Parity Error Count                 : 0
     Link Failure Count                 : 0
     Aborted Command Count              : 0
     SMART Warning Count                : 0
  • Pergunta 1: Como faço o dispositivo lógico reconhecer o disco? Eu tenho tentei novamente no LD, limpe, verifique e inicialize no disco em si, mas nada ajuda ...
  • Pergunta 2: Existe alguma chance de corrigir isso e recuperar os dados? Eu tenho um backup, mas há mais de 40TB de dados e recuperando isso de backup não será engraçado.

  • Pergunta 3: Existe alguma chance de que, se eu alterar o estado LD para OPTIMAL, eu conserte a si mesmo?

  • Pergunta 4: Alguma outra ideia sobre como corrigir isso?

Muito obrigado antecipadamente por qualquer sugestão!

    
por wwn 06.06.2018 / 09:34

1 resposta

1

Consegui consertar isso por meio de:

arcconf SETSTATE 1 LOGICALDRIVE 0 OPTIMAL ADVANCED nocheck noprompt

Imediatamente após a alteração do estado da unidade lógica, a matriz começou a ser reconstruída automaticamente. Depois que a reconstrução for concluída, verifique com a correção iniciada (novamente automaticamente). Depois que o Verify terminou tudo estava OK novamente (sem perda de dados).

    
por 11.06.2018 / 13:27