Como acessar o S.M.A.R.T. valores ao usar RAID e Intel Matrix Storage?

16

Temos um array RAID 5 usando o Intel Matrix Storage (ou seja, um RAID baseado em placa-mãe). Um dos discos rígidos começou a fazer um barulho desagradável, e o array está atualmente sendo reconstruído.

Gostaríamos de interrogar o S.M.A.R.T. valores nos discos da Seagate, mas, por algum motivo, nenhum dos programas que experimentamos foi capaz de ler o S.M.A.R.T. valores.

Existe alguma técnica para ler o S.M.A.R.T. valoriza para que possamos saber qual unidade está em seus últimos passos?

    
por Contango 02.09.2011 / 16:53

6 respostas

4

Se o Intel Matrix Storage Manager não informar sobre o status da unidade (SMART), talvez (ou também) use o utilitário Seatools (inicializável) da Seagate para diagnosticar as unidades da Seagate.

Você simplesmente precisa configurar o BIOS de 'RAID' para 'IDE', e as unidades devem estar visíveis como unidades individuais para a mídia inicializável do Seatools.

Depois de usá-lo para diagnosticar a unidade, ligue o RAID novamente no BIOS e você estará de volta do jeito que estava (a configuração do RAID permanecerá). Nesse ponto, você pode planejar trocar a unidade defeituosa (se necessário).

    
por 02.09.2011 / 19:20
16

Na minha breve leitura, parece que isso pode ser um problema comum com esse controlador . Tente dar uma smartmontools . É suposto ter algum suporte experimental para o controlador Matrix.

2011-02-04: We added experimental support for disks behind Intel Matrix RAID driver on Windows. Please report your test results to the smartmontools support mailinglist.

Use /dev/csmi0,X como nome de dispositivo para acessar informações SMART de discos individuais, por exemplo, assim:

smartctl.exe -a /dev/csmi0,0

    
por 02.09.2011 / 17:17
13
O

hddguardian funciona muito bem com o controlador Intel Matrix RAID, essencialmente, é uma GUI para smartctl.

    
por 22.01.2013 / 22:41
3

O Argus Monitor mostra informações SMART para drives atrás do controlador Intel Matrix RAID:

Version 1.8.17 (01/06/2011): Support for Intel Matrix RAID controllers (ICHx chipsets).

    
por 07.01.2012 / 00:00
1

smartmontools funcionou bem para mim.

Eu tenho uma placa-mãe Asus com o controlador RAID Intel ICH10R. Dois dos HDs estão em uma configuração RAID-1 e outros dois são não-RAID regulares. Eu posso consultar qualquer um deles com smartmontools.

A interface de linha de comando é muito fácil de usar e pode ser facilmente roteirizada.

c:\>smartctl --scan
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d scsi # /dev/sdb, SCSI device
/dev/sdc -d scsi # /dev/sdc, SCSI device
/dev/csmi0,0 -d ata # /dev/csmi0,0, ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device
/dev/csmi0,4 -d ata # /dev/csmi0,4, ATA device
/dev/csmi0,5 -d ata # /dev/csmi0,5, ATA device

Isso mostra a lista de dispositivos detectados. No meu caso, os dispositivos 5 / dev / csmi0, x correspondem às várias portas SATA na placa-mãe.

Você pode consultar qualquer um deles facilmente:

c:\>smartctl -a /dev/csmi0,2
smartctl 6.3 2014-07-26 r3976 [x86_64-w64-mingw32-win7-sp1] (sf-6.3-1)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint F2 EG
Device Model:     SAMSUNG HD154UI
Serial Number:    XXXXXXXXXXXXXX
LU WWN Device Id: X XXXXXX XXXXXXXXX
Firmware Version: 1AG01118
User Capacity:    1,500,301,910,016 bytes [1.50 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7, ATA8-ACS T13/1699-D revision 3b
Local Time is:    Thu Apr 16 21:59:25 2015 PDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
...

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   015    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   070   070   007    Pre-fail  Always       -       9700
  4 Start_Stop_Count        0x0032   098   098   050    Old_age   Always       -       2506
  5 Reallocated_Sector_Ct   0x0033   100   100   051    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   015    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   037    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   097   097   050    Old_age   Always       -       14655
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   018    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   050    Old_age   Always       -       2500
 13 Read_Soft_Error_Rate    0x000e   100   100   014    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   050    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   051    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   050    Old_age   Always       -       2
188 Command_Timeout         0x0032   100   100   050    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   061   034    Old_age   Always       -       33 (Min/Max 13/33)
194 Temperature_Celsius     0x0022   065   060   034    Old_age   Always       -       35 (Min/Max 13/35)
195 Hardware_ECC_Recovered  0x001a   100   100   026    Old_age   Always       -       767683535
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   018    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   048    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   062    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   099   010    Old_age   Always       -       3
201 Soft_Read_Error_Rate    0x000a   100   100   010    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

ID # 5 e # 198 são de interesse particular. Houve um interesse no estudo do Google que indicou que eles são bons indicadores de quando a unidade está prestes a falhar.

    
por 17.04.2015 / 07:06
1

As ferramentas smartmon também funcionaram para mim, mas apenas para as unidades espelhadas. Não iria ler os dados do meu Intel SSD ... o Intel SSD Toolbox faz isso embora.

  • placa-mãe Intel BX58SO
  • Firmware / BIOS RAID 1 (espelhado)
  • Unidades: Seagate ST3500320NS
  • SO: Windows 10 de 64 bits

Eu também descobri que o software AIDA64 (antigo Everest) funciona. Mais fácil de ler do que dados brutos, mas essa ferramenta não é gratuita. Lê o S.M.A.R.T. dados do SSD e spinners espelhados

Como outros notaram, o artigo da WikiPedia sobre S.M.A.R.T. vale bem a pena ler.

    
por 13.09.2015 / 04:47