Reinseriu um disco RAID. Definido como estrangeiro. Importa ou desmarca a escolha correta?

6

Eu reinseri um disco RAID, em um servidor DELL com o Windows Server 2008. O indicador de status da unidade estava mudando entre uma luz verde e âmbar, e o monitor deu a seguinte mensagem:

    There are offline or missing virtual drives with preserved cache.
    Please check the cables and ensure that all drives are present.
    Press any key to enter the configuration utility.

Eu pressionei uma tecla e o utilitário de configuração do BIOS integrado PERC 6 / I mostrou que o status do RAID para esse disco estava off-line.

Após a reinserção do disco, o monitor apresenta a seguinte mensagem:

    Foreign configuration(s) found on adapter.
    Press any key to continue or ‘C’ load the configuration utility,
    or press ‘F’ to import foreign configuration(s) and continue.

Após checar na net, não tenho certeza se devo escolher importar ou limpar. Não consigo descobrir se uma importação significa importar informações da matriz / sistema para o disco agora externo ou o outro caminho, ou seja, importar informações do disco externo para a matriz / sistema que estava realmente funcionando bem. Além disso; se clear é uma coisa necessária para fazer antes de uma reconstrução daquele disco, ou se meios claros para limpar o sistema de alguma forma o tornam pronto para importar as informações do disco externo para o array / sistema. Eu imagino que fazer a escolha errada aqui pode ser fatal.

Por favor, ajude a esclarecer isso dizendo o que escolher e por quê.

EDITAR: Encontrei mais algumas informações na solução de problemas do suporte da dell.com:

  • Limpar estrangeira se a matriz estiver funcionando, Importar estrangeira se a matriz estiver off-line.

Na mesma página, o suporte da dell também diz:

Regra de ouro

  • Se a matriz afetada estiver atualmente funcional e os dados estiverem acessíveis, limpe a configuração estrangeira.

  • Se a matriz afetada não estiver funcionando no momento, importe a configuração estrangeira.

No meu caso, o Windows não inicializa, só recebo o texto mencionado acima e, ao pressionar uma tecla, é aberto o PERC, que mostra os discos como on-line, exceto o disco externo.

Então eu preciso saber como isso é definido. Minha matriz é funcional ou não funcional e como saber?

@JimNim, obrigado por uma resposta detalhada. Depois de acertar o ESC enquanto estava no menu PERC, o servidor me disse para usar Ctrl + Alt + Del e reinicializado. Apareceu a mensagem com o Ctrl + R , e tentei usar essa combinação de teclas. Não sei se cheguei onde você me queria, já que o monitor mostrou as mensagens mencionadas anteriormente e, depois de apertar as teclas, voltei ao menu PERC. Assumindo que isso é onde Ctrl + R me pegaria. Por favor, ajude a analisar o que fazer e se ainda há uma esperança de colocar o servidor em funcionamento ou se você precisar de mais alguns detalhes.

O menu PERC está mostrando o seguinte:

Página principal do VD Mgmt :

  • Controlador 0
  • Grupo de discos 0
  • discos virtuais
    • Disco virtual 0 (RED)
    • Disco virtual 1 (RED)
  • Discos físicos
  • Alocação de espaço
  • Peças de reposição

VD Mgmt lado direito, enquanto destaca o Controlador 0 :

Presente de configuração estrangeira Suporte do Controlador:

  • DG Contagem: 1
  • Contagem VD: 2
  • Contagem PD: 6

VD Mgmt lado direito, enquanto destaca o Grupo de discos 0 :

Presente de configuração estrangeira Grupo de discos 0 Prop:

  • Contagem VD: 2
  • Contagem PD: 5
  • Avl: 0,000MB
  • Seg. livre: 0
  • HS dedicado: 0

VD Mgmt lado direito, enquanto destaca o disco virtual 0 :

Presente de configuração estrangeira Disco virtual 0 Prop:

  • Nível de RAID: 5
  • Status do RAID: off-line
  • Tamanho: 97,656 GB
  • Operação: nenhuma

VD Mgmt lado direito, enquanto destaca o Disco virtual 1 :

Presente de configuração estrangeira Disco virtual 1 suporte:

  • Nível de RAID: 5
  • Status do RAID: off-line
  • Tamanho: 4.450TB
  • Operação: nenhuma

Página principal do gerenciamento de PD :

  • 00: SEAGATE, on-line
  • 01: WD, on-line
  • 02: WD, on-line
  • 03: SEAGATE, estrangeiro
  • 04: SEAGATE, Falha
  • 05: SEAGATE, on-line
por Petrus 04.11.2013 / 08:24

3 respostas

2

Bem-vindo ao serverfault! Com base nas informações que você forneceu em sua postagem de "resposta" (você deve editar sua pergunta para fornecer informações extras, não postar uma resposta):

Oh querida. Parece que você tinha um disco com falha e, em seguida, o array ejetou outro disco por qualquer motivo - dado que o resultado do que aconteceu foi fatal, ele ejetou um dos discos "em funcionamento" durante a reconstrução para o hotspare (levando você para dois falha / indisponibilidade de discos do conjunto de trabalho atual), ou você não tinha um ponto de acesso e a ejeção levava você para dois discos off-line. Dois discos off-line em RAID5 = morte súbita.

Você provavelmente pode beijar os dados nesse adeus na matriz - na melhor das hipóteses, você já terá algum dano no sistema de arquivos a partir dos dados que não puderam ser removidos do cache para o disco.

Em qualquer caso, seu conjunto de raids "não está funcional" (seus discos virtuais estão off-line). Portanto, com base nas instruções da Dell encontradas, você deve "importar" o array externo e esperar adicioná-lo ao existente raid5 array sem muito dano resultante do estado impuro - mas basicamente você já deve estar se preparando para começar do zero, porque há toda chance de o controlador criar um conjunto adicional de discos virtuais offline com todos menos uma unidade faltando baseado no " disco "estrangeiro" importado.

Se por algum milagre parece funcionar, você deve fazer verificações extensivas que tudo que você precisa para ser legível / funcional neste servidor é de fato legível / funcional - ou melhor ainda, planeje reinstalá-lo de qualquer maneira, porque depois deste tipo de falha, a integridade dos dados no volume está sob séria dúvida.

Você não menciona se estava ciente de que uma das unidades já estava com falha, portanto, como uma ação de acompanhamento, certifique-se de ter o monitoramento configurado para todos os seus arrays RAID para tentar minimizar o risco daqui para frente.

    
por 05.11.2013 / 16:45
1

Você tem dois discos com falha. RAID5 + 2 discos com falha = matriz com falha.

Você tem duas opções a partir daqui:

  1. Envie as unidades para uma empresa de recuperação e permita que elas recuperem seus dados. É provável que você recupere quase todos (se não todos) os seus dados. Isso provavelmente lhe custará US $ 2.500, mais o custo de novas unidades, porque você não deve usar as unidades antigas novamente.
  2. Continue a brincar com sua configuração, arriscando a perda total de todos os seus dados.
por 05.11.2013 / 17:40
0

Você precisará usar Ctrl + R durante a inicialização para entrar na tela de configuração do adaptador PERC. De lá, você deve ser capaz de ver se a unidade em questão é a única unidade em estado "externo" e se o conjunto RAID está degradado / on-line ou falhou. Se apenas uma unidade for estrangeira, você quase certamente não desejará importá-la; Este poderia ser um método seguro para acabar com dados corrompidos dentro do conjunto RAID, e você teria que fazer alguns reparos no sistema de arquivos no mínimo, se não reinstalar o seu sistema operacional e restaurar os dados de backup. Se as unidades MULTIPLE forem estrangeiras e o RAID aparecer como com falha, você deverá tentar uma importação. Isso geralmente tem uma boa chance de colocar o RAID novamente online. Normalmente, a limpeza é uma boa ideia se o RAID for simplesmente degradado / on-line, e apenas uma única unidade for mostrada como estrangeira - você limparia esse cenário porque a unidade em questão não tem mais dados precisos atualizados para o RAID conjunto e uma reconstrução é necessária. Se a importação não resolver o problema, uma opção de último recurso seria uma "retag", recriando o conjunto de RAID do zero sem inicializar.

Eu recomendo que você entre em contato com o suporte para obter ajuda adicional se o sistema ainda estiver na garantia (não tenho certeza da utilidade do suporte fora da garantia com esse tipo de problema).

    
por 04.11.2013 / 15:32