Medir o desgaste do SSD por trás do controlador LSI MegaRAID?

4

Estou tentando descobrir como medir o total de bytes gravados (ou uma porcentagem do máximo esperado, está bem) para alguns poucos conjuntos RAID atrás de controladores LSI. Os controladores são todos controladores LSI MegaRAID SAS 9271-8i. Eu tentei usar o MegaRAID Storage Manager e a MegaCLI, mas nenhum deles parece mostrar as informações de que preciso. Eu encontrei algumas soluções online, mas elas parecem ser apenas para Linux, onde você pode corrigir o kernel ou usar o smartctl de maneiras não convencionais. Isso não funciona para mim no Windows.

Eu realmente gostaria de evitar tirar as unidades, colocá-las em outra máquina, testar com a SMART e, em seguida, colocá-las de volta. Seria uma dor real no pescoço. Se for importante, cada controlador tem dois grupos de unidades virtuais de 4 discos cada, em RAID10, com SSDs SAS formando os grupos.

    
por jski 28.10.2014 / 14:45

3 respostas

3

Eu não me preocuparia em assistir ao desgaste do SSD atrás de um controlador RAID de hardware. Você está usando o RAID por um motivo, então deixe o controlador lidar com isso.

É um bônus que você está executando com drives SAS corporativos. Se os SSDs estiverem bem adaptados à carga de trabalho (write-heavy / read-optimized / etc.), não deve haver necessidade de se aprofundar.

Neste caso, o seu controlador LSI 9271 tem sua tecnologia SSD Guard (acionada pelos números SMART que você procura) que pode aproveitar um SSD hot-spare se você estiver preocupado com desgaste rápido ou alguma condição de falha prematura.

    
por 28.10.2014 / 15:12
1

Estou usando megacli e smartctl no Ubuntu Linux.

Primeiro, obtenha o ID do dispositivo de uma das unidades SSD:

megacli -pdlist -aALL -NoLog | egrep '(Raw Size|Inquiry Data|Device Id)'

Por exemplo, o ID do dispositivo 5 . Então você executa:

smartctl -x -d megaraid,5  /dev/sda

Isso mostra um extenso relatório S.M.A.R.T para a unidade SSD conectada ao controlador Broadcom / Avago / LSI MegaRAID.

    
por 28.02.2017 / 23:34
0

No CentOS eu certamente monitore SSDs com smartctl, para ler arquivos aleatórios eu executo as pilhas Dell gen 12, 13 e 14 com não-Dell Samsung EVO 840, 850 e 860. Não escolha o Samsung PRO, embora seja mais caro flap aleatoriamente para algumas pessoas, conforme relatado em fóruns da Dell e estragar todo o volume. EVO durou 3 anos e até RAID 5 ainda sobreviveu. ~ 3 de repente morreu fora do crescente lote de disco de ~ 66.

No CentOS a cada x horas, executo um ciclo de 0 a 23 para um PERC RAID baseado em LSI Dell R720 / 730 / 740xd por meio de um script Python e SSH e compara o desvio de valores importantes com o comando abaixo + um analisador personalizado esta saída e um DB para armazenar data + valor para rastrear desvios:

smartctl -a -d sat+megaraid,0 /dev/sda

Eu acho importante observar se eu estou me aproximando dos terabytes garantidos da Samsung, escritos como "241 Total_LBAs_Written", como se os usuários estivessem abusando do limite de gravação, eles podem começar a morrer de repente e o RAID não vai ajudar, assim como realocações que podem indicar que você precisará em breve de uma reposição.

    
por 09.11.2018 / 04:09