Existe uma maneira de ler atributos SMART para unidades em uma SAN?

2

Estamos executando uma matriz SSD em uma SAN e o desempenho é ótimo. Mas precisamos monitorar os atributos SMART de resistência de gravação para que possamos determinar quando as unidades estão quase gastando. Testamos essas unidades e confirmamos que poderíamos obter esses dados, mas não tentamos na SAN. Agora, descobrimos que nossa SAN (um Dell PowerVault) não tem como consultar dados SMART. Tudo o que ele faz é consultar alguns atributos e gerar um relatório. Esse relatório não contém os atributos de que precisamos.

Existe alguma maneira de acessar os dados SMART dos nossos drives sem tirá-los da matriz e colocá-los em outra máquina para ler os dados?

    
por Josh Yeager 27.03.2014 / 14:15

4 respostas

1

O MD3620f não fornece essas informações por meio do Gerenciador de armazenamento em disco modular, SMcli, nem inclui dados SMART em nenhum dos arquivos do pacote de suporte.

Sua única esperança de obter dados SMART sem remover as unidades seria por meio de pesquisa SNMP, já que isso tende a coletar todos os dados que possam possivelmente ser extraídos de todos os componentes no compartimento. Se o SNMP não fornecer os dados, o firmware do controlador provavelmente nem mesmo extrairá dados SMART de discos SATA.

Fonte: experiência em primeira mão como Engenheiro Sênior de suporte a arrays da série MD3 para a Dell

Editar: ewwhite também faz um excelente ponto - não há uma necessidade real de monitorar proativamente os SSDs neste array, a menos que você continue a usá-lo após seu fim de vida ou sem cobertura de garantia (nesse caso, esses dados seria pelo menos "útil"). Se você estiver usando os SSDs para armazenamento em cache, não há necessidade de se preocupar. Uma falha de SSD pode ter um pequeno impacto no desempenho, mas após a substituição da garantia, as coisas são boas como novas. Se você estiver usando os SSDs como parte de um grupo de discos (sem usar os recursos mais recentes de armazenamento em cache SSD ou de pool de discos), considere usar o RAID6 para não ter nenhum risco de alto nível.

    
por 28.03.2014 / 22:35
4

De um modo geral, isso é gerenciado pelo firmware do seu armazenamento. Também não é problema seu, porque se um SSD falhar, ele será substituído pelo fornecedor, independentemente de como você o usa.

    
por 27.03.2014 / 19:48
3

Você está sem sorte para consultá-los diretamente. Seu dispositivo SAN precisará fornecer esses dados de alguma forma (SNMP ou alguma interface de monitoramento proprietária).

    
por 27.03.2014 / 17:58
3

Concordo com o sentimento de deixar o storage array lidar com isso. Existem tantos equívocos sobre como manter e gerenciar o armazenamento SSD ...

Trate-os como discos neste caso.

  • RAID eles.
  • Tenha peças de reposição.
  • Mantenha seu contrato de suporte ativo.
  • Lucro

Não há necessidade de substituir preventivamente seus SSDs. Se você tiver um carregamento de gravação realmente pesado, deverá também usar SSDs otimizados para essa carga de trabalho. Eles existem!

Um exemplo do que um SSD empresarial SAS pode reportar por meio de um controlador RAID ou SAN:

  physicaldrive 1I:1:4
     Port: 1I
     Box: 1
     Bay: 4
     Status: OK
     Drive Type: Data Drive
     Interface Type: Solid State SAS
     Size: 400 GB
     Firmware Revision: HPD9
     Serial Number: 00197356
     Model: HP      MO0400FBRWC     
     Current Temperature (C): 29
     Maximum Temperature (C): 43
     Usage remaining: 99.51%
     Power On Hours: 11672
     Estimated Life Remaining based on workload to date: 98765 days
     SSD Smart Trip Wearout: False
     PHY Count: 2
     PHY Transfer Rate: 6.0Gbps, Unknown
    
por 28.03.2014 / 22:51