Diagnosticando o sistema que reconhece persistentemente as unidades SATA, mas se recusa a reconhecer a unidade SAS ou sua substituição?

2

Eu fiz um pouco de solução de problemas, mas estou completamente perdido o que poderia estar acontecendo.

Hardware / plataforma

  • Placa-mãe Supermicro X10SRi-F
  • EVGA 850W G2 PSU (uma das mais bem classificadas para qualidade de energia em Jonnyguru.com)
  • 128 RDIMM DDR4 Crucial
  • LSI 9211-8i PCIe HBA passou para o último P20-IT (do site da LSI / Avago)
  • Cabo de conexão 8087 para quad-SAS (novo: veja esta foto , o tipo de cabo onde o lado da energia aceita um conector SATA PSU)
  • Drive SAS Seagate 6TB (novo: ST6000NM0054)
  • Vários outros discos SATA Seagate de 3 TB - 6 TB SAB (teste)

Problema / solução de problemas até o momento

Este é um novo servidor sendo configurado, portanto, todos os componentes são novos, embora alguns já tenham sido testados anteriormente.

Durante a inicialização, o HBA não reconheceu ou relatou a unidade SAS de 6TB (seja pelo BIOS principal ou por meio de sua própria topologia OROM - > SAS) e a unidade de 6TB estava fria e não girando. Nenhuma outra unidade foi conectada. O resto do sistema funciona bem, portanto, a questão é limitada a um ou mais problemas de HBA, cabo defeituoso ou disco defeituoso.

Resolução de problemas até agora:

  1. Unidade SAS de 6 TB conectada usando um terminador diferente no cabo quádruplo e o cabo quádruplo nas duas portas 8087. Nenhuma mudança - implica que o problema não é um terminador ou porta específica.
  2. Conectou vários discos SATA Seagate 3TB-6TB usando o mesmo cabo (mesmo fabricante e faixa moderna semelhante para eliminar problemas sutis de compatibilidade, se houver). Todos reconhecidos, relatados e perfeitamente integrados na inicialização, tanto nas portas 8087 quanto nos 4 terminadores, e em várias reinicializações - implica que o HBA e o cabo funcionam bem, pelo menos para o SATA. (Seria estranho se eles funcionassem perfeitamente para o SATA, mas não para o SAS.)
  3. Manteve conexões idênticas, mas substituiu as unidades SATA pela unidade SAS de 6 TB, sem alterar mais nada. Como antes, o drive SAS de 6 TB não foi reconhecido ou relatado pelo HBA e não foi desenvolvido.
  4. Tentei exatamente o mesmo com um controlador RAID diferente de placa e placa m-LSI 9260-8i em um desktop baseado em ASUS. Mais uma vez, todas as unidades SATA são imediatamente reconhecidas e geradas, mas a unidade SAS de 6 TB não é / não é.
  5. Relutantemente, concluiu-se que, por mais improvável que fosse, o problema mais provável era o drive 6TB SAS DOA e o RMA. ("Relutantemente" é porque eu nunca tive um DOA antes, as unidades são geralmente confiáveis, e se ele estiver morto, então, muito mais usual / esperado, é que ele é, pelo menos, reconhecido, mas não funcional. t figura um problema mais provável do que o DOA completo.
  6. Acabou de receber a substituição da garantia - e obteve sintomas exatamente idênticos aos da substituição : (a) Quando a unidade SAS de 6 TB e qualquer unidade SATA estão conectadas a 2 terminadores e o sistema inicializa, O drive SATA é imediatamente reconhecido, relatado e gira, enquanto a unidade SAS de 6 TB permanece frio e parado. (b) Quando o SAS de 6 TB e qualquer unidade SATA conectada à placa RAID 9260-8i na outra área de trabalho ASUS, a unidade SATA também é imediatamente reconhecido, mas a unidade SAS de 6 TB permanece fria.
  7. Como último passo, leia novamente o manual do usuário do 9211-8i HBA, caso eu tenha perdido alguma coisa pela primeira vez, e verifiquei novamente o BIOS. Não é possível encontrar nada que pareça explicar isso, ou qualquer declaração de que os drives SAS não serão reconhecidos a menos que / até < alguma ação / conteúdo & gt ;.

Realmente não acreditei que foi a primeira vez do DOA. Definitivamente não acredito que é um DOA agora. Mas se não, então o que é e o que posso estar perdendo?

Eu testei tudo (AFAIK) na cadeia de componentes, o HBA simplesmente não tem muita interface OROM que pode dar errado, ou quaisquer opções para reconhecer SATA / SAS / ambos, ou qualquer coisa assim, e os principais PC / servidor em ambos os casos, basta deixar a detecção para a placa HBA / RAID. Eu testei em duas plataformas completamente diferentes, com dois modelos diferentes de placas controladoras, com drives SAS vs SATA, e estou completamente perplexo.

(Nota: estou um pouco limitado, já que estou começando a transição do SATA para o SAS, com a intenção de substituir o SATA pelo SAS enquanto eles se desgastam, então no momento não tenho nenhum outros discos SAS ou cabos para testar, o que eu teria feito também. Mas eu acho que provavelmente cobri isso testando as placas + cabos enquanto varias SATA / SAS)

Atualizado para um título mais preciso para ajudar os outros. Agora, mais informações foram obtidas. Veja a resposta.

    
por Stilez 22.11.2016 / 23:40

2 respostas

3

Falei com o suporte técnico da LSI (agora Avago) para armazenamento, na Alemanha. Eles consideraram que, se dois tipos diferentes de controladores "conhecidos" em duas máquinas diferentes reconheciam todos os sata, mas não essa unidade sas (em qualquer porta e conector), então era muito provável que a unidade.

Eles também sugeriram um teste adicional - para conectar apenas o lado da alimentação da unidade (NÃO HBA / placa-mãe / cabos de dados) e ligar o servidor. (Ele me avisou que ficaria "louco"!) Aparentemente, como o SATA, os drives SAS aceleram quando são acionados pela primeira vez se o lado dos dados não estiver conectado (eu não sabia disso, gostaria de saber como o start funciona ?) , fornecendo um teste muito bom que depende apenas da PSU e alimentação de energia para a unidade, e nada mais.

Com certeza, o SATA impulsiona tudo, essa unidade não. Ele sentiu que era o suficiente para ser "quase certo", é um segundo impulso ruim, por mais improvável que fosse, sem gastar dinheiro. O número de série também era quase idêntico ao drive original (1 dígito de mudança); então ele também sugeriu falar com o fabricante e levantar a questão se eles têm outros relatórios semelhantes para esta unidade, já que pode ser um lote ruim.

Atualização de abril de 2017:

Pensei durante algum tempo que o problema era que o BIOS LSI 9211 precisava ser desativado, com base em um thread on-line. Desativei o BIOS e ele funcionou ... mas depois, quando mudei a caixa, parou de funcionar e não consegui entender por quê. Eu levei esta informação de volta para o suporte técnico da LSI e eles disseram que não era possível que o BIOS pudesse ser o problema ou desativá-lo poderia ajudar. Eles sentiram que mover a caixa provavelmente teria desfeito um cabo fortuito funcionando e voltado a não funcionar.

Eles disseram para tentar um novo cabo "avançado" ou "fanout" e, especificamente, Adaptec (ao lado, como um concorrente!), que são mais confiáveis do que a maioria para o SAS. Eles disseram que nem sempre foi claro ou marcado se um cabo era do tipo certo ou não, e verificar cuidadosamente.

O cabo SAS exato necessário varia dependendo da interface que o HDD e o cartão têm. O 9211 tem uma conexão SFF-8087 e meu HDD tem uma conexão SFF-8082 (parece um pouco com o SATA, mas as portas de energia e dados se juntaram).

Eu estava em dúvida sobre ser o cabo (já que o cabo funcionava bem em SATA eletricamente similar), mas seguiu em frente e entrou em contato com a Adaptec, que comentou que acertar o cabo pode ser bastante desafiador de cabo é necessário. Eles verificaram as especificações do cartão e as especificações do HDD e recomendaram seu 2275300-R na Amazon, e para meu espanto funcionou na primeira vez, então eu acho que eles devem saber do que estão falando.

    
por 25.11.2016 / 07:03
0

Na verdade, a causa real desse luto se deve a mudanças no padrão de energia SATA / SAS. O pino 3 é o problema.

Usar um poder de estilo molex corrigirá esse problema ao usar unidades SAS mais recentes (criadas após 2016).

Portanto, não importa se são cabos (a menos que use molex para energia), HBA ou drives, tudo aponta para isso. Diversão, né?

link

    
por 25.10.2018 / 18:25