unidades SSD de terceiros no servidor HP Proliant - monitorando a integridade da unidade

2

Conforme discutido em uma pergunta anterior , temos 6 unidades OWC Mercury Extreme SATA SSD instaladas em nosso servidor HP Proliant DL360 G7 (usando um controlador RAID P410i). Eles funcionam muito bem e são muito rápidos. No entanto, estou ciente de que as unidades SSD infelizmente não duram para sempre, e o utilitário HP ACU, não surpreendentemente, não monitora a integridade de nenhuma das unidades:

Alguém sabe de algum software ou utilitários do Windows (Server 2008R2) que permitam monitorar a integridade de cada unidade individual na matriz, para que possamos detectar proativamente possíveis problemas?

    
por KenD 20.08.2013 / 20:31

2 respostas

4

Você pode usar o smartctl para observar unidades individuais atrás de um controlador RAID cciss da seguinte forma:

smartctl -a -l ssd /dev/sda -d cciss,1

ou:

smartctl -a -l ssd /dev/sda -d sat+cciss,1

(pode ser necessário remover -l ssd se o seu smartctl for muito antigo)

    
por 20.08.2013 / 21:19
3

Não se preocupe ... Realmente.

Você tem um servidor corporativo com uma controladora RAID corporativa e unidades hot-swap (com um 5 garantia de um ano ), presumivelmente em uma configuração RAID 1 + 0. Você se importa por que uma unidade falha além do fato de que ela falha? Eu não. Eu não me importo com a morte de um disco giratório (erros S.M.A.R.T., falha de rolamento, superaquecimento, etc. )

Os discos HP de estado sólido (SAS) high-end do fornecem algumas informações de integridade adicionais. Mas se você estiver usando o RAID e souber onde obter um sobressalente, não acho que essa informação seja extremamente útil. Você obtém leituras de temperatura e uma figura "Estimated Life Restante" .

Isso é tudo.

  physicaldrive 1I:1:4
     Port: 1I
     Box: 1
     Bay: 4
     Status: OK
     Drive Type: Unassigned Drive
     Interface Type: Solid State SAS
     Size: 400 GB
     Firmware Revision: HPD9
     Serial Number: 00197356
     Model: HP      MO0400FBRWC     
     Current Temperature (C): 29
     Maximum Temperature (C): 43
     Usage remaining: 99.57%
     Power On Hours: 6418
     Estimated Life Remaining based on workload to date: 61922 days
     SSD Smart Trip Wearout: False
     PHY Count: 2
     PHY Transfer Rate: 6.0Gbps, Unknown
    
por 20.08.2013 / 22:43