MegaCLI causa drive “Outro erro”

1

Estou tendo um problema em que a execução de "megalci -PDList -aAll" fará com que um outro erro seja registrado em dois dos seis discos em um par de servidores que possuo. Aqui está isso novamente em mais detalhes.

Eu tenho dois servidores Dell R610. Cada um tem 6 discos organizados da seguinte forma:

2 discos SATA de 160 gb no RAID 1

4 discos SAS de 300GB em RAID 10

Quando executo comandos megacli que verificam os discos, isso faz com que um erro seja registrado nas unidades SATA. Isso vale para os dois servidores, o que significa que 4 unidades são afetadas.

Eu preciso de duas coisas, preciso de ajuda para descobrir por que isso está acontecendo e como pará-lo, e também preciso de ajuda para fazer com que os erros desapareçam, para que o Nagios me deixe em paz. Atualmente estou aberto a quaisquer métodos para atingir esses objetivos.

Os dois servidores estão no CentOS 6.3 x64. O erro ocorre se eu uso MegaCLI versão 1.01.39, versão 8.02.21 ou versão 8.04.07. Aqui está a saída do Megacli -PDList -aAll para os três primeiros drives. Isso mostra as duas unidades ruins e uma boa.

[root@nfs1b ~]# /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aAll

Adapter #0

Enclosure Device ID: 32 Slot Number: 0 Drive's postion: DiskGroup: 0, Span: 0, Arm: 0 Enclosure position: N/A Device Id: 0 WWN: Sequence Number: 2 Media Error Count: 0 Other Error Count: 1001 Predictive Failure Count: 0 Last Predictive Failure Event Seq Number: 0 PD Type: SATA

Raw Size: 149.049 GB [0x12a19eb0 Sectors] Non Coerced Size: 148.549 GB [0x12919eb0 Sectors] Coerced Size: 148.5 GB [0x12900000 Sectors] Firmware state: Online, Spun Up Device Firmware Level: 8A22 Shield Counter: 0 Successful diagnostics completion on : N/A SAS Address(0): 0x1221000000000000 Connected Port Number: 0(path0) Inquiry Data: K85DTA926Y1YFUJITSU MHZ2160BK G2 8A22 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: Unknown Link Speed: Unknown Media Type: Hard Disk Device Drive Temperature : N/A PI Eligibility: No Drive is formatted for PI information: No PI: No PI Port-0 : Port status: Active Port's Linkspeed: Unknown Drive has flagged a S.M.A.R.T alert : No

Enclosure Device ID: 32 Slot Number: 1 Drive's postion: DiskGroup: 0, Span: 0, Arm: 1 Enclosure position: N/A Device Id: 1 WWN: Sequence Number: 2 Media Error Count: 0 Other Error Count: 1001 Predictive Failure Count: 0 Last Predictive Failure Event Seq Number: 0 PD Type: SATA

Raw Size: 149.049 GB [0x12a19eb0 Sectors] Non Coerced Size: 148.549 GB [0x12919eb0 Sectors] Coerced Size: 148.5 GB [0x12900000 Sectors] Firmware state: Online, Spun Up Device Firmware Level: 8A22 Shield Counter: 0 Successful diagnostics completion on : N/A SAS Address(0): 0x1221000001000000 Connected Port Number: 1(path0) Inquiry Data: K85DTA926W8EFUJITSU MHZ2160BK G2 8A22 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: Unknown Link Speed: Unknown Media Type: Hard Disk Device Drive Temperature : N/A PI Eligibility: No Drive is formatted for PI information: No PI: No PI Port-0 : Port status: Active Port's Linkspeed: Unknown Drive has flagged a S.M.A.R.T alert : No

Enclosure Device ID: 32 Slot Number: 2 Drive's postion: DiskGroup: 1, Span: 0, Arm: 0 Enclosure position: N/A Device Id: 2 WWN: Sequence Number: 2 Media Error Count: 0 Other Error Count: 0 Predictive Failure Count: 0 Last Predictive Failure Event Seq Number: 0 PD Type: SAS

Raw Size: 558.911 GB [0x45dd2fb0 Sectors] Non Coerced Size: 558.411 GB [0x45cd2fb0 Sectors] Coerced Size: 558.375 GB [0x45cc0000 Sectors] Firmware state: Online, Spun Up Device Firmware Level: D1S4 Shield Counter: 0 Successful diagnostics completion on : N/A SAS Address(0): 0x50014ee7aab51c32 SAS Address(1): 0x0 Connected Port Number: 2(path0) Inquiry Data: WD WD6001BKHG D1S4WXF1E62KUYR7 FDE Capable: Not Capable FDE Enable: Disable Secured: Unsecured Locked: Unlocked Needs EKM Attention: No Foreign State: None Device Speed: Unknown Link Speed: Unknown Media Type: Hard Disk Device Drive Temperature :26C (78.80 F) PI Eligibility: No Drive is formatted for PI information: No PI: No PI Port-0 : Port status: Active Port's Linkspeed: Unknown Port-1 : Port status: Active Port's Linkspeed: Unknown Drive has flagged a S.M.A.R.T alert : No

enter code here

Como este é um cartão fabricado pela LSI com uma marca da Dell, não consigo ajudar a Dells a usar a ajuda da MegaCLI ou da LSI por causa da nova marca. Meu Google não trouxe benefícios.

    
por Kellen 26.02.2013 / 19:08

2 respostas

2

Em relação a por que isso está acontecendo, parece que essa versão do software MegaCli emite comandos não suportados por unidades SATA. Você pode verificar isso obtendo o log de eventos do controlador:

MegaCli64 -AdpEventLog -GetLatest 100 -f events.log -aALL

Após a execução, um arquivo events.log conterá os eventos de erro do controlador. Se, de fato, a causa for um comando não suportado emitido para a unidade, seus eventos de erro devem ser parecidos com:

Event Description: Unexpected sense: PD 07(e0x20/s7) Path 1221000007000000, CDB: 4d 00 4d 00 00 00 00 00 20 00, Sense: 5/24/00

O código de sentido de 5/24/00 , de acordo com esta tabela de códigos comuns , é "Solicitação ilegal - campo inválido em CDB (bloco de descritor de comando) ".

    
por 24.12.2015 / 18:41
1

Encontrei uma resolução para este problema.

Eu finalmente encontrei uma versão da MegaCLI 4 e que parece gostar dos meus antigos drives SATA do Fijutsu.

Caso o link fique obsoleto no futuro, o download ainda deve estar disponível no site da LSI se você estiver interessado em um pouco de escavação - por uma razão obscura é intitulado" MegaRAID 820X MegaCLI - Linux, versão 3.00.03 "e está oferecendo a versão 4.00.16 como um download.

    
por 01.03.2013 / 01:54