Não posso executar testes SMART em discos de nossos servidores e não posso garantir se eles suportam esse recurso ou não (CentOS 7.2).
Breve história : Temos um monte de servidores idênticos, aqueles que estão em um grande cluster de dados. Em um deles estamos chegando (aproximadamente a média de dois em uma semana) discos remontados como somente leitura.
Eu queria executar testes SMART para esses discos para descobrir o motivo subjacente desse problema repetitivo, mas não posso executar os testes SMART. Quando quero apenas a informação, tudo bem:
[root@bigd08 ~]# smartctl -i /dev/sdj
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 13:51:32 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
Bem, diz "Ativado". Se eu quiser obter informações completas:
[root@bigd08 ~]# smartctl --all -d scsi /dev/sdj -H
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 10:47:10 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Error Counter logging not supported
Device does not support Self Test logging
ou tente testar:
[root@bigd08 ~]# sudo smartctl -t short /dev/sdj1
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
Short offline self test failed [unsupported scsi opcode]
Eu também tentei executar o comando selecionando scsi como tipo de dispositivo e no modo permissivo, mas a saída é a mesma. No entanto, não tentei outros tipos de dispositivos possíveis: ata, sat [ auto] [ N] [+ TIPO], usbcypress [ X], usbjmicron [ p] [ x] [ N], usbsunplus, marvel, areca, N / E, 3ware, N, hpt, L / M / N, megaraid, N, cciss, N, automático, teste
(a opção "test" diz que eles são scsi) Eu deveria experimentá-los? Eu tentei obter algumas dicas da saída abaixo:
root@bigd08 ~]# lspci -knn | grep 'RAID bus controller'
03:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
07:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
Não, não tenho pistas. Eu ainda quero acreditar que eles apóiam a SMART. Eles foram comprados no começo deste ano e não é 2017? Eles devem ter! Os discos são da marca HP, bem como servidores e controladores RAID, mas o fabricante é a Seagate (ST6000NM0024).
Eu verifiquei o manual do produto e vi alguns bits que indicam o suporte SMART. captura de tela do manual da Seagate
link
Eu não sei quais bits ele menciona e como posso verificá-los na linha de comando. Eu suponho que eles são os bits para os quais eu vejo no primeiro comando smartctl que eu executo: "Available", "Enabled".
Existem muitos tópicos na Internet que são semelhantes ao meu caso, mas a maioria deles é sobre discos USB e excluídos.
Agradeço qualquer ajuda que eu realmente precise para obter discos estáveis. Também aceito seus comentários para saber por que eles podem ficar somente para leitura com tanta frequência.
Tags hard-drive smart centos-7