O HP ProCurve 5412zl inicializa com energia quando está conectado ao no-break

4

O switch de chassi HP ProCurve 5412zl do cliente é reinicializado ocasionalmente, apesar de ser alimentado por quatro fontes de alimentação redundantes e sob proteção da UPS.

Essas reinicializações geralmente acontecem durante uma queda de energia real ou durante um evento de falta de energia ou de baixa voltagem. Todo o equipamento ligado ao UPS permanece ligado, exceto pelo interruptor.

O no-break para o rack é um APC SmartUPS SUA3000XL 208V com transformador redutor. Essa opção fornece PoE para telefones e pontos de acesso em toda a instalação. As células da bateria estão saudáveis, foram substituídas recentemente e têm carga total.

Esses blips têm o efeito de reinicializar todos os telefones da instalação e desconectar os usuários de suas sessões. É perturbador.

Nos registros do switch:

 Keys:   W=Warning   I=Information
         M=Major     D=Debug E=Error
----  Event Log listing: Events Since Boot  ----
I 02/17/16 22:26:31 03802 chassis: System Self test started on  Master
I 02/17/16 22:26:31 03803 chassis: System Self test completed on  Master
I 02/17/16 22:26:35 00061 system: -----------------------------------------
I 02/17/16 22:26:35 00062 system: Mgmt Module 1 went down without saving crash
            information
M 02/17/16 22:26:35 03001 system: System reboot due to Power Failure

e informações sobre a versão:

valley-core# sh version
Image stamp:    /ws/swbuildm/rel_orlando_qaoff/code/build/btm(swbuildm_rel_orlando_qaoff_rel_orlando)
                Nov 19 2014 15:17:26
                K.15.16.0005
                335
Boot Image:     Secondary

Durante anos, eu não percebi que você tem que modificar as configurações da fonte de alimentação neste modelo de comutador, mas esta unidade é configurada corretamente para tirar proveito do várias PSUs.

valley-core# sh power-over-ethernet

 Status and Counters - System Power Status

  System Power Status    : Full redundancy
  PoE Power Status       : Full redundancy

 Chassis power-over-ethernet:

  Total Available Power  :  600 W
  Total Failover Power   :  600 W
  Total Redundancy Power :  600 W
  Total Used Power       :  359 W +/- 6W
  Total Remaining Power  :  241 W

 Internal Power

        Main Power
  PS    (Watts)       Status
  ----- ------------- ---------------------
  1     300           POE+ Connected
  2     300           POE+ Connected
  3     300           POE+ Connected
  4     300           POE+ Connected

 External Power
        EPS1   /Not Connected.
        EPS2   /Not Connected.

Informações adicionais da PSU:

valley-core# sh system power-consumption

 Slot Power Usage:
 Slot  Module Description                        Current Power
 ----- ----------------------------------------- ---------------
 A     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 B     HP J9536A 20p GT PoE+/2p SFP+ v2 zl Mod   23 W
 C     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 D     HP J9534A 24p Gig-T PoE+ v2 zl Module     19 W
 E     HP J9534A 24p Gig-T PoE+ v2 zl Module     17 W
 F     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 G     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 H     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 K     HP J9534A 24p Gig-T PoE+ v2 zl Module     18 W
 L     HP J9534A 24p Gig-T PoE+ v2 zl Module     19 W

valley-core# sh system power-supply

Power Supply Status:

 PS#    Model       State        AC/DC  + V      Wattage
 ---- --------- ------------- ----------------- ---------
   1   Unknwn    Powered         AC 120V           875
   2   Unknwn    Powered         AC 120V           875
   3   Unknwn    Powered         AC 120V           875
   4   Unknwn    Powered         AC 120V           875

   4 /  4 supply bays delivering power.
   Total power: 3500 W

O que é único é que o switch é o único dispositivo que perde energia. Nenhum dos servidores conectados tem problemas de energia, apesar de estar na mesma bateria ou PDU.

Eu posso admitir que o poder neste local é ruim e sofre com quedas de voltagem e picos ocasionais. Mas o no-break nem registrou uma falha durante essa recente inicialização a quente.

Tenho outro 5412zl em um cliente não relacionado que fez a mesma coisa várias vezes no passado.

Alguma idéia do que eu posso fazer sobre isso? Devo tentar mover duas das PSUs para a energia da concessionária, em vez de todas estarem no no-break?

Editar:

O histórico de inicialização mostra:

vale-core # sh boot-history

Mgmt Module 1 -- Saved Crash Information (most recent first):
=============================================================
ID: 29008d6a
Active system went down: 02/01/16 09:23:54 K.15.16.0005 335
Switch rebooting due to temporary loss of power or low voltage

ID: 994a405a
Active system went down: 12/14/15 11:31:15 K.15.16.0005 335
switch rebooting due to temporary loss of power or low voltage

Uma nota de alteração da HP em uma revisão de firmware anterior diz:

Power (CR_0000112424) - When the switch is exposed to AC power fluctuations and the voltage drops too low, the switch reboots and generates an incorrect error message saying the switch crashed. With this fix, the error message is changed to "Switch rebooting due to temporary loss of power or low voltage".

Isso é consistente com esta nota técnica .

    
por ewwhite 18.02.2016 / 13:36

4 respostas

3

Meus pensamentos iniciais e imediatos estão na linha do que você está pensando. Se esses blips estiverem ocorrendo independentemente de quaisquer programações de autoteste que você configurou no no-break (se os disparos ocorrerem em alguma porcentagem do tempo enquanto estiver em um autoteste, você terá um problema de no-break / transformador / carga), faria exatamente o que você está sugerindo. Mova algumas das PSUs para um feed diferente e veja se as ocorrências se repetem. Se eles o fizerem - e eu não estou sugerindo isso de forma leve - abra um caso com a HP. Pode ser um processo doloroso e tedioso. No entanto, eles provavelmente podem ajudar a fornecer orientações para obter informações reais de depuração do switch. Eu também levaria um momento para verificar as notas de lançamento / buglists para a versão atual do firmware no switch também.

    
por 18.02.2016 / 14:08
4

De acordo com esta página , sua série UPS é do tipo "line interactive". Essa designação significa que não está constantemente convertendo a energia da rede elétrica para CC e voltando ao nível de rede novamente. Em vez disso, está apenas sentado ali, monitorando a energia e mantendo as baterias carregadas. A energia de entrada é passada diretamente, embora possa ser passada através de algumas bobinas e um dispositivo de proteção contra surtos ao longo do caminho para segurança extra.

Quando a energia da rede elétrica cair ou sofrer uma queda de tensão, o UPS precisará trocar seu inversor para o circuito para começar a fornecer energia da bateria para o equipamento conectado. Independentemente de como esta comutação é feita (vai ser um relé físico ou de estado sólido), você sempre verá uma "lacuna" de alguns milissegundos. Além disso, o inversor do UPS provavelmente não estará em fase com a energia da rede elétrica, de modo que a forma de onda AC salta para a nova fase.

A maioria dos equipamentos realmente não se importa se a energia de entrada é perdida por alguns milissegundos. Os capacitores na fonte de alimentação geralmente são grandes o suficiente para passar por pequenas falhas sem problemas. Eu vi muitos servidores e equipamentos de rede fazerem um par de ciclos perdidos completos sem nenhuma falha.

Minha suspeita seria de que as PSUs deste switch em particular são um pouco mais críticas do que a maioria. Eu acho que seu problema poderia ser resolvido obtendo outro no-break (que é continuamente no circuito de conversão de AC-DC-AC) para executar o switch off. Este tipo de UPS é muitas vezes referido como "online", embora você deva verificar com o seu fornecedor para confirmar que está obtendo o tipo certo.

    
por 18.02.2016 / 18:24
2

Com as informações que você acabou de adicionar na edição, é bem claro.

2 possíveis causas vêm à mente:

1) O no-break, quando na verdade precisa fazer o trabalho, diminui levemente a voltagem de saída e a taxa de mudança é grande o suficiente para fazer com que o switch tenha uma condição de baixa energia. Eu já vi isso acontecer com as unidades da UPS antes. O único remédio é pegar alguma carga da UPS ou obter uma UPS maior.
Em alguns casos: Se o no-break tiver vários circuitos de saída, a redistribuição da carga pode ajudar. Idealmente, cada circuito deveria mais ou menos ter a mesma carga. Isso minimiza a queda de tensão nas saídas.

2) Outra possibilidade, embora bastante rara, também se aplica a unidades UPS com múltiplas saídas. Pode ser que as saídas não sejam exatamente sincronizadas considerando a fase do AC que elas fornecem.
Se as PSUs de seu switch conectarem-se a vários circuitos com uma diferença de fase, a placa de alimentação dentro do switch que combina a potência de suas PSUs pode ter problemas para sincronizar e causar o mesmo problema. Nesse caso, a solução é exatamente a mesma: Coloque tudo no mesmo circuito.

    
por 18.02.2016 / 17:19
1

O interruptor diz que há uma queda de energia. As luzes do teto dizem que há uma queda de energia. Eu estou supondo que não há poder, mesmo que apenas brevemente. Isso não tem nada a ver com o switch e tudo a ver com o no-break.

Eu checo duas vezes o cabeamento de energia entre o switch e o no-break, verifique se ele está realmente conectado onde você está, talvez coloque o switch em um no-break diferente por um tempo só para ver. Pode ser que esse switch seja um pouco mais sensível à bateria do que seus outros dispositivos, especialmente considerando que ele está fornecendo energia para todos os seus telefones; que pode somar rápido.

    
por 18.02.2016 / 16:10