Na sexta-feira eu tive um desastre absoluto. Fui ao datacenter para montar um novo servidor e, ao mesmo tempo, levei um novo disco comigo para substituir uma unidade que havia falhado há algumas semanas em um array iSCSI HP P2000 G3 de 10 Gbits.
O P2000 é carregado com discos 12 x 2TB 7.2k MDL SAS e configurado como 2 arrays RAID10, cada um com 4 drives + 2 hot spares. Eu já havia removido o disco com falha uma semana antes, seu lugar na matriz tinha sido tirado automaticamente por uma das peças de reposição como esperado.
Então, a tarefa em mãos era uma substituição de unidade simples para me devolver um hot spare. Simples certo? Deslize o disco, certifique-se de que esteja visível na GUI e configure-o como um hot spare ...
Não ...
Eu abri o novo disco da embalagem e coloquei no lugar, instantaneamente todas as unidades da matriz ficaram laranja. Eu verifiquei a GUI e cada disco estava exibindo 'Metadados inválidos', uma verificação rápida dos serviços em execução usando os dois arrays confirmou que tudo havia perdido a visibilidade dos LUNs.
Eu verifiquei novamente os canais, reiniciei todos os controladores sem efeito. As unidades começaram a desaparecer da GUI e os meus VDs (LUNs) também estavam ausentes da GUI. Eu removi o novo disco também, ainda nada.
Em um ato de desespero e confusão, eu puxei a energia para o P2000 e deixei-a reinicializar completamente. Ele voltou a ficar on-line e pude ver meu VD novamente ... No entanto, os dois arrays perderam toda a redundância, como se cada metade dos 2 RAID10 tivesse perdido seus discos espelhados.
Todos os outros discos que faziam parte da matriz agora estavam sendo exibidos como disponíveis. Eu era capaz de configurá-los como hot spares e os 2 RAID10 começaram a reconstrução. Agora está sendo executado novamente, tudo sem meu novo disco, já que estou com muito medo de colocá-lo novamente.
Alguém tem alguma ideia do que aconteceu aqui?
A única coisa em que consigo pensar é que o novo disco deve conter metadados e confundir o P2000. No entanto, foi um novo disco selado do nosso fornecedor habitual. No entanto, mesmo se este fosse o caso, eu não esperaria que o array fizesse alguma coisa com esse disco que afetasse a configuração RAID existente!
Ajuda por favor!