Falha na matriz HP MSA70 / P800 - mostra 2 unidades em cada slot, 13/25 unidades “ausentes”

3

Temos um HP MSA70 com unidades DP SAS 10k HP de 25 x 600 GB, conectado a um controlador HP P800. As unidades são configuradas no RAID 6.

Ontem, ocorreu um "evento" desconhecido e o array foi desconectado. Nós reinicializamos o servidor (executando o CENTOS 6.2) e na inicialização, o Array Controller relatou que 13 das unidades estão "ausentes". Quando olhamos para o volume no gerenciamento do Array, há duas entradas para cada slot dos slots 1-12. Um mostra uma unidade de 600gb e um mostra uma unidade de 0gb. Não há mais entradas após 12.

Entramos em contato com o suporte da HP, que nos enviou para o suporte da Camada 2 e, depois de muitas horas, desistiu. Eles disseram que nunca viram isso antes (o que eu mais gosto de ouvir de um vendedor).

Alguém já viu isso antes e perdemos todos os dados?

Obrigado.

    
por NXTVoipguy 26.08.2015 / 03:12

1 resposta

5

Velho, velho, velho, antigo ...

  • O CentOS 6.2 é antigo (6.2, 6 de dezembro de 2011 (kernel 2.6.32-220))
  • O HP StorageWorks MSA70 é antigo . (fim da vida - outubro de 2010)
  • O HP Smart Array P800 é antigo . (fim da vida - 2010)

Isso me faz pensar que o firmware e os drivers também são antigos. Por exemplo. não há razão para rodar o CentOS 6.2 em 2015 ... E estou assumindo que nenhum esforço foi feito para manter algo atualizado.

Isso também me faz pensar que os sistemas não estão sendo monitorados. Supondo o hardware do servidor HP, o que o sistema IML registra? Você está executando agentes de gerenciamento da HP? Caso contrário, mensagens importantes sobre o servidor e a integridade do armazenamento poderiam ter sido perdidas.

Você verificou as informações do HP Array Configuration Utility (ou HP SSA )

Mas, no final, você provavelmente sofreu uma falha na porta ou uma falha no expansor / backplane:

  • Quantos cabos SAS estão conectados ao gabinete? Se um cabo estiver conectado, você provavelmente terá um problema de backplane devido ao expansor SAS no gabinete.
  • Se dois cabos estiverem conectados, você poderá ter um cabo SAS, um controlador MSA70 ou uma falha na porta P800.

Seus dados provavelmente estão intactos, mas você precisa isolar o problema e determinar qual dos problemas acima é o culpado. Substituir um cabo SAS é muito mais fácil do que trocar o controlador MSA70 ou a placa controladora RAID ... mas eu acho que você pode obter outro MSA70 por US $ 40 no eBay ...

    
por 26.08.2015 / 03:40