O switch de chassi HP ProCurve 5412zl do cliente é reinicializado ocasionalmente, apesar de ser alimentado por quatro fontes de alimentação redundantes e sob proteção da UPS.
Essas reinicializações geralmente acontecem durante uma queda de energia real ou durante um evento de falta de energia ou de baixa voltagem. Todo o equipamento ligado ao UPS permanece ligado, exceto pelo interruptor.
O no-break para o rack é um APC SmartUPS SUA3000XL 208V com transformador redutor.
Essa opção fornece PoE para telefones e pontos de acesso em toda a instalação. As células da bateria estão saudáveis, foram substituídas recentemente e têm carga total.
Esses blips têm o efeito de reinicializar todos os telefones da instalação e desconectar os usuários de suas sessões. É perturbador.
Nos registros do switch:
Keys: W=Warning I=Information
M=Major D=Debug E=Error
---- Event Log listing: Events Since Boot ----
I 02/17/16 22:26:31 03802 chassis: System Self test started on Master
I 02/17/16 22:26:31 03803 chassis: System Self test completed on Master
I 02/17/16 22:26:35 00061 system: -----------------------------------------
I 02/17/16 22:26:35 00062 system: Mgmt Module 1 went down without saving crash
information
M 02/17/16 22:26:35 03001 system: System reboot due to Power Failure
e informações sobre a versão:
valley-core# sh version
Image stamp: /ws/swbuildm/rel_orlando_qaoff/code/build/btm(swbuildm_rel_orlando_qaoff_rel_orlando)
Nov 19 2014 15:17:26
K.15.16.0005
335
Boot Image: Secondary
Durante anos, eu não percebi que você tem que modificar as configurações da fonte de alimentação neste modelo de comutador, mas esta unidade é configurada corretamente para tirar proveito do várias PSUs.
valley-core# sh power-over-ethernet
Status and Counters - System Power Status
System Power Status : Full redundancy
PoE Power Status : Full redundancy
Chassis power-over-ethernet:
Total Available Power : 600 W
Total Failover Power : 600 W
Total Redundancy Power : 600 W
Total Used Power : 359 W +/- 6W
Total Remaining Power : 241 W
Internal Power
Main Power
PS (Watts) Status
----- ------------- ---------------------
1 300 POE+ Connected
2 300 POE+ Connected
3 300 POE+ Connected
4 300 POE+ Connected
External Power
EPS1 /Not Connected.
EPS2 /Not Connected.
Informações adicionais da PSU:
valley-core# sh system power-consumption
Slot Power Usage:
Slot Module Description Current Power
----- ----------------------------------------- ---------------
A HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
B HP J9536A 20p GT PoE+/2p SFP+ v2 zl Mod 23 W
C HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
D HP J9534A 24p Gig-T PoE+ v2 zl Module 19 W
E HP J9534A 24p Gig-T PoE+ v2 zl Module 17 W
F HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
G HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
H HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
K HP J9534A 24p Gig-T PoE+ v2 zl Module 18 W
L HP J9534A 24p Gig-T PoE+ v2 zl Module 19 W
valley-core# sh system power-supply
Power Supply Status:
PS# Model State AC/DC + V Wattage
---- --------- ------------- ----------------- ---------
1 Unknwn Powered AC 120V 875
2 Unknwn Powered AC 120V 875
3 Unknwn Powered AC 120V 875
4 Unknwn Powered AC 120V 875
4 / 4 supply bays delivering power.
Total power: 3500 W
O que é único é que o switch é o único dispositivo que perde energia. Nenhum dos servidores conectados tem problemas de energia, apesar de estar na mesma bateria ou PDU.
Eu posso admitir que o poder neste local é ruim e sofre com quedas de voltagem e picos ocasionais. Mas o no-break nem registrou uma falha durante essa recente inicialização a quente.
Tenho outro 5412zl em um cliente não relacionado que fez a mesma coisa várias vezes no passado.
Alguma idéia do que eu posso fazer sobre isso? Devo tentar mover duas das PSUs para a energia da concessionária, em vez de todas estarem no no-break?
Editar:
O histórico de inicialização mostra:
vale-core # sh boot-history
Mgmt Module 1 -- Saved Crash Information (most recent first):
=============================================================
ID: 29008d6a
Active system went down: 02/01/16 09:23:54 K.15.16.0005 335
Switch rebooting due to temporary loss of power or low voltage
ID: 994a405a
Active system went down: 12/14/15 11:31:15 K.15.16.0005 335
switch rebooting due to temporary loss of power or low voltage
Uma nota de alteração da HP em uma revisão de firmware anterior diz:
Power (CR_0000112424) - When the switch is exposed to AC power
fluctuations and the voltage drops too low, the switch reboots and
generates an incorrect error message saying the switch crashed. With
this fix, the error message is changed to "Switch rebooting due to
temporary loss of power or low voltage".
Isso é consistente com esta nota técnica .