P4500 Relatório SAN à esquerda degradado em um nó quando todos os discos estão em funcionamento "NORMAL"

2

Estou passando por uma condição estranha com nosso cluster SAN esquerdo da HP G1. O cluster consiste em 4 nós em dois locais, dois nós (nó 1 e 2) em cada site são RAID5 em todo o par e são espelhados em nosso site de DR (Nó 3 e 4).

O nó 3 no site de DR está reportando a degradação no CMC, no entanto, ao inspecionar os discos no CMC, todos os discos estão relatando "Health Normal" com um status "ativo"

/ dev / cciss / c0d1 na configuração do RAID está reportando degradado, e os discos neste controlador estão relatando "seguro para remoção" como "não"

Alguém tem alguma idéia sobre o que pode estar acontecendo, o dispositivo está fora do período de garantia.

    
por FIASITManager 28.08.2014 / 02:44

3 respostas

1

Da minha experiência, você deve acessar a página de gerenciamento do System Insight

link x = endereço IP dos nós usuário "sanmon" password "sanmon"

Verifique o status dos discos e o status dos controladores de raid.

Meu palpite você encontrará aí o seu problema.

    
por 12.04.2015 / 22:34
0

Isso soa como um problema de firmware com uma unidade, backplane ou controlador RAID. Você tem um disco ruim, mas algo está impedindo o relatório correto da falha.

Eu recomendo que você verifique seu firmware de cima para baixo e atualize conforme necessário. A HP possui um documento que lista os níveis de firmware recomendados e suportados para seu hardware. O documento está enterrado em seu site, então ligar e pedir a versão mais recente é a melhor maneira de obtê-lo. Tenha muito cuidado com a ordem em que você aplica suas atualizações de firmware. Há algumas etapas específicas de atualização que, se não forem seguidas, resultarão em uma placa-mãe ou controlador em blocos.

Se você estiver se sentindo aventureiro, basta reiniciar o nó em questão. A unidade defeituosa provavelmente aparecerá durante o init RAID.

    
por 28.08.2014 / 18:59
0

Se o dispositivo /dev/cciss/c0d1 estiver degradado, significa que você tem algum problema de hardware nos discos.

O suporte precisa verificar o relatório do ADU e descobrir quais discos relatam erros de leitura.

Se você tiver vários discos com erro e precisar ser substituído, o suporte poderá tornar esse nó de armazenamento em modo de reparo, substituir os discos defeituosos, reconfigurar o RAID e finalmente o nó de reinicialização dos nós de cluster sobreviventes (você não tem nenhum Volumes NRAID0)

    
por 13.01.2016 / 14:05