Como monitorar o status do disco rígido por trás do Dell PERC H710 Raid Controller com o CentOS 6?

20

Eu tenho um servidor Dell executando CentOS 6 usando o cartão PERC H710 Raid Controller com a configuração do Raid 5 e quero monitorar o status de falha / trabalho do disco rígido por trás do Raid Controller.

Então eu deveria ser capaz de usar um script bash para monitorar o status do disco rígido e enviar e-mails de alerta se algo correr mal.

A ferramenta de comando LSI MegaRAID SAS (Sobre as ferramentas Linux do LSI MegaRAID SAS) para CentOS / Red Hat / Linux NÃO suporta PERC H710 e smartctl também NÃO o suporta.

Baseado no site da Dell, CentOS IS não é suportado para este servidor ( NX3200 PowerVault ) e eu não consegui baixar nenhum programa do Linux para monitorar o disco rígido.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Alguém sabe como monitorar o status do disco rígido por trás da invasão de hardware no Dell PERC H710 com o CentOS 6?

    
por Xianlin 15.04.2014 / 10:51

6 respostas

22

S.M.A.R.T. não é a palavra final em disco ou monitoramento de armazenamento !! É um componente, mas os controladores RAID modernos o usam junto com outros métodos para determinar a integridade da unidade e da matriz.

Estou assumindo que este é um controlador PERC em um servidor Dell PowerEdge.

A abordagem normal do Linux para monitorar a integridade do hardware da Dell é instalar os agentes Dell OMSA para Linux via Yum - link

yum install srvadmin-all instalará o conjunto completo de agentes. Uma vez instalado, você pode usar o comando omreport para obter informações sobre o seu array.

Exemplos:

omreport storage vdisk

omreport storage pdisk controller=0

    
por 15.04.2014 / 15:58
18

Você pode ver o status SMART dos discos com o comando smartctl e é -d argument. Por exemplo, para ver o primeiro disco na matriz:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Isso está no Scientific Linux 6 (outro sistema operacional baseado no RHEL6) com o smartmontools-5.43-1.el6.x86_64.

    
por 10.07.2014 / 12:30
7

A resposta aceita recomenda a audácia que é yum install srvadmin-all . Blecch. Veja como torná-lo um pouco menos superficial (mas ainda assim, apesar de tudo, você pode ficar muito mais enxuto na plataforma da HP. Mas eu discordo ...) Com isso quero dizer, instale apenas os componentes necessários para gerenciar o armazenamento em sua máquina. .

BTW, a resposta direta à pergunta do usuário está no item "Mostrar discos físicos no vdisk 0" na lista abaixo.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Adicionar ao .bashrc da raiz:

export PATH=$PATH:/opt/dell/srvadmin/bin

Aproveite:

Comandos RAID

  • Mostrar todos os discos físicos no controlador 0

    omreport storage pdisk controller=0

  • Mostrar todos os discos lógicos no controlador 0

omreport storage vdisk controller=0

  • Mostrar todos os discos físicos no vdisk 0

omreport storage pdisk controller=0 vdisk=0

  • Reconfigure um vdisk para ser raid1 de raid0 ( COOL !!!! )

omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3

  • Crie um vdisk em um novo disco:

omconfig storage controller controller=0 action=clearforeignconfig omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2

Mais informações

Como reconfigurar meu disco em uma máquina Dell no Linux?

BTW, uma vez que isso não é nada mais do que uma placa LSI MegaCLI da marca Dell, você pode achar a resposta de Han Solo ainda melhor! Eu ainda tenho que tentar, no entanto.

A doçura

Aqui está um exemplo de saída do omreport, canalizado através do grep para um delicioso pacote de dados:

# omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D
    
por 05.04.2016 / 21:57
6

Eu estava me esforçando para fazer com que funcionasse no CentOS e encontrei um pacote de trabalho aqui link

chamado " MegaCli-8.07.10-1.noarch.rpm "

A referência de comando link

Espero que ajude.

    
por 16.02.2016 / 02:15
3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
    
por 15.09.2015 / 11:44
-1

Oi eu tenho um cartão Dell PERC / LSI semelhante e eu precisava verificar o status do RAID. LSI tem um utilitário chamado sas2ircu que eu achei bastante útil, existe também uma versão para Windows e Linux.

    
por 13.08.2016 / 16:08