Eu tenho:
SAN do Openfiler
ML370 G5
Smart Array 6400
ranhura 1
Matriz B
O Logical Drive 2 é um conjunto RAID5 de 6 unidades de hotk hot plug de 148GB que produz 680 GB
sem reposição
Sexta-feira passada, a energia acabou, esta máquina estava apenas ligada à parede e caiu com força. Quando ele voltou, os inversores 1 e 4 de 0-5 foram alterados para a luz de falha piscando em vermelho. O gráfico do guia de matriz mostra que, como "falha de previsão foi recebida para essa unidade, substitua o mais rápido possível". Na linha de comando, o utilitário hpacucli relata a mesma mensagem; Falha previsível. As luzes de atividade piscam normalmente. O gráfico de falhas diz que o inversor não "falhou" até que o LED de falha esteja aceso.
Durante tudo isso e agora uma semana depois, o sistema permanece ativo e nenhum usuário relatou nenhum problema até agora - todos os hosts ESX / VMs estão usando essa SAN e ainda estão funcionando bem e eu fiz manualmente um backup de tudo na matriz e novas unidades apareceram hoje. Então eu posso tentar algumas coisas sem muito esforço, mas tenho certeza que gostaria de substituir as unidades e ter um trabalho de reconstrução se eu for cuidadoso.
Normalmente eu diria que com apenas uma falha de previsão eu poderia conseguir substituí-los um de cada vez, permitindo que eles reconstruíssem um de cada vez e ficassem bem, MAS quando eu executo o hpacucli eu recebo a seguinte saída no LD
Matriz: B
Tipo de Interface: SCSI Paralelo
Espaço não utilizado: 0 MB
Status: OK
Logical Drive: 2
Size: 683.6 GB
Fault Tolerance: RAID 5
Heads: 255
Sectors Per Track: 32
Cylinders: 65535
Stripe Size: 64 KB
Status: OK
Array Accelerator: Enabled
Parity Initialization Status: Initialization Failed
Unique Identifier: 600508B100104B39535153303250000F
Disk Name: /dev/cciss/c0d1
Mount Points: None
Logical Drive Label: A01E9878P57820K9SQS02PBE24
Portanto, o status é OK, mas a inicialização de paridade é o que me assustou. Qualquer orientação sobre um procedimento para ter uma reconstrução bem-sucedida foi apreciada - ou conselhos ao longo das linhas de "todos os dados são suspeitos agora mesmo, apenas substitua os discos defeituosos, faça um novo array e restaure desde que você tenha backup" também. Eu entendo que é um risco, não importa o quê. Devo reiniciar antes de tentar substituir alguma coisa?
Saída hpacucli completa na parte inferior.
Parece que, se essa falha preditiva for apenas um erro SMART se acumulando, ela ainda teria paridade e reconstrução, talvez devagar?
Muito obrigado por qualquer orientação, paz!
--- hpacucli completo ---
Matriz: B
Tipo de Interface: SCSI Paralelo
Espaço não utilizado: 0 MB
Status: OK
Logical Drive: 2
Size: 683.6 GB
Fault Tolerance: RAID 5
Heads: 255
Sectors Per Track: 32
Cylinders: 65535
Stripe Size: 64 KB
Status: OK
Array Accelerator: Enabled
Parity Initialization Status: Initialization Failed
Unique Identifier: 600508B100104B39535153303250000F
Disk Name: /dev/cciss/c0d1
Mount Points: None
Logical Drive Label: A01E9878P57820K9SQS02PBE24
physicaldrive 1:0
SCSI Bus: 1
SCSI ID: 0
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY83F3Y00007442557Q
Model: COMPAQ BD14685A26
physicaldrive 1:1
SCSI Bus: 1
SCSI ID: 1
Status: Predictive Failure
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY8393700007345XU2M
Model: COMPAQ BD14685A26
physicaldrive 1:2
SCSI Bus: 1
SCSI ID: 2
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY9NWGY00007524BFV1
Model: COMPAQ BD14685A26
physicaldrive 1:3
SCSI Bus: 1
SCSI ID: 3
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY9PA1N00007523W3DP
Model: COMPAQ BD14685A26
physicaldrive 1:4
SCSI Bus: 1
SCSI ID: 4
Status: Predictive Failure
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY72WR9000075216UNS
Model: COMPAQ BD14685A26
physicaldrive 1:5
SCSI Bus: 1
SCSI ID: 5
Status: OK
Drive Type: Data Drive
Interface Type: Parallel SCSI
Transfer Mode: Ultra 3 Wide
Size: 146.8 GB
Transfer Speed: 160 MB/Sec
Rotational Speed: 10000
Firmware Revision: HPB8
Serial Number: 3HY9NT3F000075231R9V
Model: COMPAQ BD14685A26