raid 5 épico falhar # 2

1

seguinte -

Parte 1
https://serverfault.com/questions/83262/raid-5-rebuilding-epic-fail ,

conseguiu colocar o controlador de ataque meio funcionando ..

quando minha distro linux (pmagic) inicializa, tanto quanto eu posso dizer que ele vê os discos rígidos e tenta montá-lo como scsi2, mas depois ele falha dizendo:

3w-xxxx: scsi2: Command failed: status = 0xc7, flags = 0x59, unit #0
sd 2:0:0:0: WARNING: Command (0x28) timed out, resetting card.

e, em seguida, apenas trava e não responde a ctrl, alt + delete , então provavelmente o kernel pânico?

Estou assumindo que a unidade # 0 indica que há uma falha no disco rígido na posição 0 no controlador RAID. Mas certamente, se esse fosse o caso, o controlador de ataque não teria deixado passar?

também alguma idéia de quais são os sinalizadores e status? ive tentou pesquisar no google, mas continua retornando erros aleatórios de fontes irrelavent. Felicidades

    
por Aceth 16.11.2009 / 18:10

2 respostas

2

Você está vendo tempos limite de scsi na unidade 0.

algumas perguntas:

  1. a matriz está degradada ou falhou?
  2. quais são os tipos de disco rígido, a idade e as versões de firmware?
  3. mesmo sobre o próprio controlador

Existem alguns cursos a seguir:

  1. se a matriz estiver funcionando, mas degradada, atualize as versões de firmware do HDD e o controlador (primeiro o driver e depois o firmware) e tente recriar. Tempos limite de SCSI geralmente são causados por firmware com bugs em discos e controladores, e não por erros reais. Se a reconstrução falhar - substitua o disco
  2. se a matriz falhar, você pode tentar rotular novamente a matriz (limpe as configurações do controlador, insira os discos, crie uma nova raid5 semelhante à antiga e não deixe o controlador reinicializar a nova matriz. puxe o disco que falhou primeiro offline manualmente). Isso marcará as unidades como pertencentes à matriz e poderá colocar a matriz on-line em um estado degradado e, em seguida, usar a opção 1.
  3. Se os dados não forem importantes (ou seja, você tiver um backup), poderá começar a testar o disco e o controlador, conectando o disco a outro conector no controlador, para verificar se não é o cabo / conector que está se comportando mal aqui. ou você pode inserir uma boa unidade conhecida para testar o conector - tudo depende de você
  4. recolocar o controlador também pode ajudar
  5. se for um servidor de marca, você pode ligar para o suporte, provavelmente você ouvirá o que eu já disse, mas os caras de suporte devem ter links para drivers e firmware à mão, e devem estar cientes dos problemas atuais atuais
por 16.11.2009 / 18:49
0

Sim, a Unidade 0 é quem apresenta o (s) problema (s)

Uma lista dos sinalizadores SCSI link

    
por 16.11.2009 / 18:57

Tags