array RAID5 pronto para reconstrução

2

Eu herdei a administração de um servidor com um array RAID 5. Temos um banco de dados danificado na matriz que está um pouco acima da metade do tamanho alocado, tornando a recuperação impossível.
Recentemente eu mudei o disco reserva no compartimento 25 para fazer parte da matriz (daria espaço adequado para a recuperação do banco de dados), a reconstrução parecia começar bem.
Mas, em seguida, um disco defeituoso no compartimento 22 foi relatado. Isso foi substituído e agora estou preso com o servidor mostrando o status de configuração da matriz "RAID5, pronto para reconstrução". Alguém pode ajudar?

=> ctrl slot=1 show config

Smart Array P600 in Slot 1    (sn: P92B3AF9SXL040)

array A (SAS, Unused Space: 297996 MB)

  logicaldrive 1 (6.3 TB, RAID 5, Ready for Rebuild)

  physicaldrive 1E:1:1 (port 1E:box 1:bay 1, SAS, 300 GB, OK)
  physicaldrive 1E:1:2 (port 1E:box 1:bay 2, SAS, 300 GB, OK)
  physicaldrive 1E:1:3 (port 1E:box 1:bay 3, SAS, 300 GB, OK)
  physicaldrive 1E:1:4 (port 1E:box 1:bay 4, SAS, 300 GB, OK)
  physicaldrive 1E:1:5 (port 1E:box 1:bay 5, SAS, 300 GB, OK)
  physicaldrive 1E:1:6 (port 1E:box 1:bay 6, SAS, 300 GB, OK)
  physicaldrive 1E:1:7 (port 1E:box 1:bay 7, SAS, 300 GB, OK)
  physicaldrive 1E:1:8 (port 1E:box 1:bay 8, SAS, 300 GB, OK)
  physicaldrive 1E:1:9 (port 1E:box 1:bay 9, SAS, 300 GB, OK)
  physicaldrive 1E:1:10 (port 1E:box 1:bay 10, SAS, 300 GB, OK)
  physicaldrive 1E:1:11 (port 1E:box 1:bay 11, SAS, 300 GB, OK)
  physicaldrive 1E:1:12 (port 1E:box 1:bay 12, SAS, 300 GB, OK)
  physicaldrive 1E:1:13 (port 1E:box 1:bay 13, SAS, 300 GB, OK)
  physicaldrive 1E:1:14 (port 1E:box 1:bay 14, SAS, 300 GB, OK)
  physicaldrive 1E:1:15 (port 1E:box 1:bay 15, SAS, 300 GB, OK)
  physicaldrive 1E:1:16 (port 1E:box 1:bay 16, SAS, 300 GB, OK)
  physicaldrive 1E:1:17 (port 1E:box 1:bay 17, SAS, 300 GB, OK)
  physicaldrive 1E:1:18 (port 1E:box 1:bay 18, SAS, 300 GB, OK)
  physicaldrive 1E:1:19 (port 1E:box 1:bay 19, SAS, 300 GB, OK)
  physicaldrive 1E:1:20 (port 1E:box 1:bay 20, SAS, 300 GB, OK)
  physicaldrive 1E:1:21 (port 1E:box 1:bay 21, SAS, 300 GB, OK)
  physicaldrive 1E:1:22 (port 1E:box 1:bay 22, SAS, 300 GB, OK)
  physicaldrive 1E:1:23 (port 1E:box 1:bay 23, SAS, 300 GB, OK)
  physicaldrive 1E:1:24 (port 1E:box 1:bay 24, SAS, 300 GB, OK)
  physicaldrive 1E:1:25 (port 1E:box 1:bay 25, SAS, 300 GB, OK)
    
por TrevorW 23.10.2014 / 17:52

2 respostas

9

Isso é um pouco louco ... Um Controlador RAID PCI-X Smart Array P600 (por volta de 2005)?!? 25 discos? RAID 5? É um gabinete HP MSA70 ? Provavelmente não é o HP D2700 ?

"Pronto para reconstrução" é sobre a pior mensagem de status de matriz que você pode receber em um sistema HP ProLiant. Isso indica que a unidade lógica não pode concluir sua reconstrução porque há problemas na leitura de um parceiro ou unidade (s) dependente (s). Geralmente, isso significa que você tem um disco com falha e um disco com falha. Isso também é conhecido como Erro de leitura irrecuperável (URE).

Por favor, veja o seguinte:

Falha do RAID 1 "Status Pronto para Reconstruir: reconstruir porcentagem concluída 0% "

HDD SAS HP Proliant ML350 G5

Force o LUN em um HP Smart Array para reconstruir

24 discos no RAID5 são estúpidos. Isso não é culpa sua. 25 discos é, no entanto. São muitas unidades para o RAID5, mesmo com os discos corporativos de 10k RPM que você possui. Perder sua reserva para adicionar 300 GB de espaço foi uma má ação por causa do impacto de I / O e tempo de expandir um grupo de discos tão grande. Ele atinge todos os discos e teria levado um longo tempo muito . Muito risco e exposição envolvidos.

Existe uma pequena chance de você estar se deparando com um problema de firmware do controlador ou limitação de configuração. A última versão do firmware para esse controlador foi em 2009. Equipamentos antigos, além de uma configuração realmente anormal como a sua, são casos de borda que exigem algum trabalho para consertar. Isso também poderia ser um problema com o gabinete.

  • Você tem bons backups?
  • Você está em condições de atualizar o firmware de todos os componentes?
  • Você pode desligar e ligar todas as mensagens POST do sistema para ler a saída do controlador RAID?
  • Você pode ser capaz de iniciar o processo de reconstrução, assumindo que não há erros READ reais nas unidades.

Portanto, é contra-intuitivo, mas um power-off, espera e poder-on pode ser sua melhor aposta. Também pode ser a sua pior aposta, por isso esperamos que você tenha backups. : (

    
por 23.10.2014 / 19:08
0

Um post antigo, eu sei, mas pode ser útil para os outros. Meu P410i faz isso na maioria das vezes, quando eu substituo um disco. O novo disco inicializa e, em seguida, diz Pronto para recriar, mas nada acontece. Quando isso acontece, eu desconectar a energia para o disco que acabei de substituir, que não iria reconstruir. Aguarde 10 a 15 segundos, e faça a replicação e, em seguida, a reconstrução é iniciada. Eu estou correndo um Raid 50 com 8 discos nele - acho que é em 6 anos e contando, e tive 3 discos defeituosos ao longo do tempo - Mas reconstruído 6 vezes, porque eu substitui por um disco temporário, até que eu tenha o direito de reposição .

    
por 25.08.2016 / 22:06