Questões de reconstrução RAID 1 Proliant

3

Eu tenho um servidor HP Proliant ML350 G5 que sofreu uma falha na fonte durante a noite. A fonte de alimentação foi substituída, mas infelizmente ela foi reiniciada com apenas 1 disco no conjunto RAID 1 conectado. (O controlador RAID é a versão do E200i).

O RAID BIOS disse então no start-up que havia entrado no Modo de Recuperação Interino. No entanto, eu teria esperado que ainda inicie com apenas a unidade 1. No entanto, o bios diz que não consegue encontrar uma unidade C: e entra em um loop de reinicialização consultando os outros dispositivos de inicialização. A primeira pergunta é: esse comportamento normal não é iniciado em 1 disco?

A segunda unidade foi então conectada (todas as unidades estão ok) e a raid bios iniciou uma reconstrução automática naquele disco. Isso parece ser um processo em segundo plano, pois não há progresso mostrado. No entanto, com base na luz piscando, parece que está funcionando. Minha segunda pergunta é quanto tempo demorará essa reconstrução? (Drive SAS de 36 GB de 15 K).

Não consigo ver nenhuma mensagem de erro e parece que está reconstruindo a unidade, mas o computador ainda não inicializa. Ainda diz durante o processo de inicialização que a unidade C: não foi encontrada. Se eu esperar a reconstrução terminar, é provável que se corrija e encontre a unidade C:? Ou há algum outro problema aqui?

Respostas

Estas são as conclusões que fiz depois de resolver este problema.

1) Não, não é normal. Em nosso sistema (como a maioria dos outros), se um dos discos do RAID 1 estiver faltando ou estiver em processo de reconstrução, o único disco restante ainda deverá funcionar bem e inicializar corretamente. (Embora o controlador caia em um modo de desempenho reduzido.)

2) A reconstrução do RAID 1 em nosso sistema levou cerca de 4,5 horas para reconstruir o disco depois que ele foi colocado de volta. Parecia um longo tempo para uma unidade SAS RAID 1 + 0 de 36 GB e 15k rpm que não estava sendo usado na época. Mas foi o que demorou. (Como um experimento, eu peguei e substituí uma unidade SAS de 10 GB rpm de 146 GB da matriz RAID 5 da máquina que usa 4 discos. Demorou menos de 2 horas.)

3) O problema fundamental que eu estava tendo com esta máquina acabou sendo uma corrupção na NVRAM da máquina. Eu só posso assumir que a falha da fonte de alimentação foi responsável por corrompê-lo. Embora não houvesse sinais óbvios no BIOS como algo estar errado. Todas as configurações pareciam como deveriam. No entanto, depois de limpar a NVRAM através do switch S6 na placa-mãe, o sistema inicializou sem problemas. Eu acho que o controlador de inicialização referenciado de alguma forma mudou em alguma configuração de BIOS subjacente. (Aliás, se você fizer isso, não se esqueça de redefinir a data e a hora antes de permitir que seu servidor seja levado com recebimento de e-mails e backups ausentes).

    
por Nicholas 15.03.2011 / 00:53

2 respostas

2

Você tem algo estranho acontecendo lá, embora eu não tenha certeza do que é.

O servidor deve inicializar e operar normalmente com apenas 1 unidade. Tudo o que deve acontecer é o controlador marcar a matriz como degradada, mas os Sistemas Operacionais não se importam (ou sequer sabem) sobre essa condição e devem continuar normalmente.

Com relação à reconstrução, normalmente eu diria que olhe para o Utilitário HP Array Diag, já que isso lhe dará alguma indicação do progresso da reconstrução. Uma vez que o sistema operacional soa aqui neste momento, o BIOS pode ter um pouco de rudimentar de configurar arrays e exibir seu status. Caso contrário, você deve poder inicializar um CD do StartSmart que contenha o utilitário HP Array Diag. Uma unidade de 36 GB deve ser reconstruída com relativa rapidez - vi um RAID1 de 36 GB em uma reconstrução do ML370 em uma manhã.

É definitivamente o BIOS dizendo que você dirige C: não foi encontrado? C: é uma coisa muito do Windows, e eu ficaria surpreso que uma BIOS referenciaria uma coisa muito centrada no Windows como essa, quando outros Sistemas Operacionais podem ser instalados (isso pode acontecer, parece-me estranho). / p>     

por 15.03.2011 / 01:17
1

is this normal behaviour not to start up on 1 disk?

Não, não em um bom controlador. Você deve operar em qualquer disco em um hardware RAID1.

My second question is how long will this rebuild take?

Demorará o tempo que for necessário. Isso geralmente pode acontecer em segundo plano enquanto o sistema está em execução. Se o seu sistema está esperando que isso aconteça, isso pode ser um mau sinal.

It still says during the boot up process that the C: drive is not found

Isso é preocupante. Eu ficaria tentado a arrancar um Livecd ou algo assim e ver se você pode ver quaisquer dados nos discos. Talvez o bootloader esteja bagunçado. Espero que você tenha bons backups recentes.

Eu vi falhas na fonte de alimentação destruir unidades no passado. Seria incomum, mas acho que isso poderia acabar com os dados.

    
por 15.03.2011 / 01:03