Dell PERC 4 (PowerEdge 2850): Incompatibilidade de configuração não resolvida entre discos e NVRAM

6

Tivemos uma queda de energia prolongada (quase quatro horas); agora eu tenho um servidor Dell PowerEdge 2850 que está me dando esse erro (de um PERC 4e / DI) na inicialização:

TodasasunidadesestãolistadasnomenudeconfiguraçãoPERC:

A unidade com falha não mostra nenhum sinal de falha nos LEDs; o fundo parece estar verde e o topo está apagado. Nenhum dos LEDs da unidade de disco está piscando.

Todas as unidades estão em um array RAID5 com 6 faixas de tamanho de 64K.

Eu tenho um ou dois Dell PE2850s disponíveis para teste. No entanto, pelo que eu li, o erro Unresolved configuration mismatch... apareceria então - mas talvez eu pudesse ativar os bons drives de qualquer maneira.

E se eu remover a unidade defeituosa e tentar inicializá-la dessa maneira? Eu posso tentar isso - mas tanto o PERC 4e / DI quanto a placa Adaptec 2410SA (ativada posteriormente no processo de inicialização) listam todas as portas como não funcionando.

Aqui estão as perguntas específicas:

  1. É possível fazer com que esse array (degradado) seja executado novamente neste sistema? Como?
  2. Ajudará a configurar uma nova configuração e salvá-la (sem inicializar)?
  3. É possível mover um array degradado para um novo sistema e ligá-lo?
  4. E se o disco "ruim" fosse removido ou substituído? Como isso afeta a inicialização do sistema? Como isso afeta a movimentação de uma matriz de disco?

EDITAR: Encontrei esta questão que parece detalhar como mover unidades de um host para outro; Existe algo mais que deve ser adicionado ao processo detalhado lá? No meu caso, o movimento seria diferente de duas maneiras: uma, eu tenho uma matriz aparentemente degradada (RAID5), e duas, a matriz é RAID5 e não RAID1. O primeiro é o maior ponto de interrogação; O RAID5 deve importar como o RAID1 eu diria.

Eu encontrei esta pergunta que fala sobre "consertar" um espelho com falha, mas não há uma resposta clara sobre como consertá-lo, e estou usando um RAID5 mesmo assim - um RAID5 que não foi movido ou reorganizado.

ATUALIZAÇÃO: O sistema de substituição tem um PERC 4 / DC - comparado ao sistema antigo que tem um PERC 4e / Di nele. Espero que isso reconheça o antigo array (degradado) e o importe bem. Se isso funcionar bem, poderei até usar as unidades antigas (sem falhas) como substituto da unidade com falha.

    
por Mei 19.02.2012 / 21:32

2 respostas

2

Parece que ele ficou um pouco maluco e está obtendo uma configuração das unidades boas e outra ligeiramente fora de sincronia ou configuração inválida da unidade "defeituosa".

A primeira coisa que gostaria de fazer é remover o disco defeituoso e tentar inicializar. Se isso não funcionar, tente com um dos seus outros 2850.

    
por 19.02.2012 / 21:55
1

O problema era - como declarado na captura de tela - que nenhuma unidade foi detectada. Isso foi, obviamente, uma surpresa, já que as unidades estavam na máquina.

Minha hipótese é a seguinte: quando o menu de configuração para o PERC foi digitado, ele não viu discos - então, em vez de pedir para escolher entre Configuração de Disco e Configuração NVRAM , mostrava a única configuração que conhecia. Isso apresentava a aparência de ter verificado os discos no sistema quando, na verdade, nenhum processo desse tipo havia ocorrido - os discos permaneciam desconhecidos para o controlador.

Eu também especulo que, como o sistema não pôde acessar as unidades eletronicamente, ele também não pôde detectar a unidade (conhecida) inválida na matriz. Assim, o LED permaneceu em um estado "bom" em vez de ruim.

Mudei os discos para um novo sistema dessa maneira:

  • Desligar o sistema antigo
  • Desligue o sistema de substituição
  • Marcou todas as unidades no sistema antigo com seus números de slot do chassi - e marcou a unidade defeituosa com uma tag red em vez de branco.
  • Marcou todas as unidades no sistema de substituição com seus números de slot do chassi (por via das dúvidas)
  • Removidas todas as unidades do sistema de substituição
  • Sistema de substituição reinicializado e configuração limpa do menu de configuração PERC
  • Desligue o sistema de substituição
  • Removidas todas as unidades do sistema antigo
  • Colocou todas as unidades no sistema de substituição (em locais correspondentes)
  • Sistema de substituição reinicializado
  • Alarme desativado no menu de configuração PERC
  • Sistema de substituição reinicializado

(Eu também tive que mudar as conexões de rede, mas isso não é relevante para a discussão aqui.)

Não houve problemas passando de um PERC 4e / Di para um PERC 4 / DC: todas as descrições nos manuais sugeriram que o único movimento que não funcionaria é passar para um PERC 2 de algo mais recente.

Depois disso, o sistema (VMware ESXi, neste caso) surgiu. Há mais a fazer, mas é tudo sobre máquinas virtuais e VMware ESXi. A caixa é boa.

Se tudo permanecer estável, substituirei a unidade defeituosa por uma das unidades do sistema desativado.

Editado para ser completo

Em outro PowerEdge 2850 idêntico (também com um PERC 4e / Di), surgiu a mesma mensagem:

1 Logical Drive(s) found on the host adapter.
0 Physical Drive(s) found on the host adapter.

Após a mensagem, nenhum erro e a máquina iniciaram normalmente. Assim, esta mensagem não é indicativa de uma falha; talvez ele só conte unidades físicas não em uma unidade lógica.

    
por 19.02.2012 / 23:12