array da unidade HP “pronto para reconstrução” (RAID5)

3

Temos um servidor ProLiant com controlador Smart Array P440ar.

Desde cerca de três semanas, as luzes "não remover" de algumas das unidades SAS estão ligadas. Talvez depois de uma perda de energia.

Se fizermos a reinicialização, isso aparecerá na tela do post:

Embedded RAID : Smart Array P440ar Controller - Configuration Required

  • 1786-Slot 0 Drive Array Recovery Needed The following SAS/SATA drive(s)

need Automatic Data Recovery (Rebuild): Port 1I, box:6, bay: 4 (SAS)

O software Smart Storage Administrator mostra o status "Pronto para reconstrução" em nosso array RAID5. Nós temos dois arrays: um RAID1 com dois discos (obviamente) e um RAID5 com três discos. O status do erro é dado para o RAID5. Ele não mostra erros em nenhuma unidade específica, apenas na matriz.

Tem sido assim há semanas. Tentamos desligar os servidores virtuais por um fim de semana para dar ao servidor "descanso" porque eu li em algum lugar que a reconstrução pode não ser iniciada se houver muita carga nas unidades. No entanto, também não começou com os servidores virtuais desligados.

Este é o link para o Relatório do ADU: link

Meu conhecimento não é bom o suficiente para ler algo útil.

Qualquer ajuda apreciada!

    
por david-c 18.04.2018 / 11:16

1 resposta

2

"Pronto para reconstrução" significa que o processo de reconstrução está bloqueado. Se estiver no array RAID5, você provavelmente se deparou com uma situação do URE onde você tem um disco com falha e um disco com falha . O disco com falha provavelmente leu erros e não pode ser lido de forma confiável para concluir a reconstrução do disco com falha.

Você deve executar um backup adequado AGORA, depois tentar desligar o hardware (unidades girando para baixo) e ligá-lo novamente. Observe os prompts do controlador e veja se isso inicia o processo de reconstrução.

Editar:

Depois de ler o relatório do ADU, dois dos três discos de 300 GB têm erros de leitura difíceis. URE é a situação provável. A perda de energia sozinha não necessariamente causaria isso. Este sistema está conectado a uma bateria de reserva?

    
por 18.04.2018 / 12:28