HP Smart Array P410 preso em pronto para recuperação 00.0%

2

Estamos usando o controlador de disco de matriz inteligente P410 da HP em nosso servidor supermicro.

Infelizmente, os HDDs de um RAID10 Array foram danificados e fomos forçados a alterar esse disco rígido específico. Após 3 dias e reiniciando o servidor 2 vezes, ainda estamos vendo a primeira mensagem de aviso depois de mudar o HDD que está dizendo:

Mensagens de status de aviso ((Pronta para recuperação) Unidade lógica 1 (931,5 GB, RAID 1 + 0)) 776 (Pronto para Recuperação) A Unidade Lógica 1 (931,5 GB, RAID 1 + 0) está na fila para reconstrução.

Estamos preocupados com o problema e decidimos verificar a atualização do firmware e esperamos que esteja atualizado e não há atualização disponível para isso.

É notável que nós mudamos o CARTÃO DE RAID com um novo com o mesmo modelo também. nossa informação sobre o dispositivo de ataque:

Firmware Version 6.40
Number of Ports 2 (Internal only)
Number of Arrays 3
    Smart Array P410 in Slot 1
Bus Interface: PCI
Slot: 1
Serial Number: PACCR9SXRCQH
Cache Serial Number: PAAVPID12031NLH
RAID 6 (ADG) Status: Disabled
Controller Status: OK
Hardware Revision: C
Firmware Version: 6.40
Rebuild Priority: Medium
Expand Priority: Medium
Surface Scan Delay: Not Available
Surface Scan Mode: High
Queue Depth: Automatic
Monitor and Performance Delay: 60 min
Elevator Sort: Enabled
Degraded Performance Optimization: Disabled
Inconsistency Repair Policy: Disabled
Wait for Cache Room: Disabled
Surface Analysis Inconsistency Notification: Disabled
Post Prompt Timeout: 15 secs
Cache Board Present: True
Cache Status: OK
Cache Ratio: 25% Read / 75% Write
Drive Write Cache: Enabled
Total Cache Size: 512 MB
Total Cache Memory Available: 400 MB
No-Battery Write Cache: Disabled
Cache Backup Power Source: Batteries
Battery/Capacitor Count: 1
Battery/Capacitor Status: OK
SATA NCQ Supported: True

Também executamos o DIAGNOSTIC REPORT Wizard e este é o relatório do nosso dispositivo:

link

Esta é uma situação muito frustrante, o Server está funcionando, mas um dos HDDs de um RAID10 ARRAY não é recuperado e unido ao RAID 10 Array.

O que devemos fazer e como resolver o problema?

Esta é também a saída deste comando na linha de comando da HP: ctrl all show config detail

link

Atenciosamente

Resolvi o problema alterando esses 3 HDDs se eu me deparasse com o problema, seguirei seu conselho recente.

Depois de alterar os HDDs inicializei o servidor com BIOSUPDATE cd do RAID CONTROLLER. Eu apaguei aquela unidade lógica e recriou isso e recuperei o servidor usando BARE METAL BACKUP

Tudo parece bem e não vejo nenhum erro e aviso na UTILITY CONFIGURATION do ARRAY.

Mas eu vejo algo não normal. Na ACU, quando clico em mais informações para essa unidade lógica recém-criada, há uma seção em que as partições dessa unidade são descritas e vejo essa linha suspeita: Número da Partição: 1, Tamanho: 100 MB, Ponto de Montagem: Desconhecido

O ponto de montagem é a unidade C, mas por que é desconhecido para o RAID? Inicialização do servidor normalmente.

Acho que isso deve ser corrigido. Você tem alguma ideia sobre isso?

    
por Armin 08.07.2014 / 08:18

1 resposta

1

Lendo sua configuração, vejo:

8 discos no total ...

  • Os discos 1,2,3,4 estão em uma matriz RAID 1 + 0.
  • Os discos 5,6 estão em uma faixa RAID 0.
  • Os discos 7,8 estão em uma faixa RAID 0.

Não vou perguntar por que você tem dois conjuntos RAID 0. Surpreendentemente, eles são saudáveis!

Parece que o disco 2 foi substituído. Ele está emparelhado com o disco 4. Você pode ter erros READ no disco 4 que estão impedindo a reconstrução do disco 2. Estes são discos SATA básicos de 500 GB, e todos os discos têm um número de erros BUS . Na verdade, não vejo contagens explícitas de erros de leitura / gravação nas unidades individuais ...

Você pode ter apenas um problema de backplane de unidade Supermicro.

Discos 1,2,3 têm Write Retries Failed (0x2b) como o "Motivo da última falha"

Se você quiser entrar nos detalhes do Relatório de diagnóstico de matriz, por favor consulte este guia .

    
por 08.07.2014 / 14:21