Em um servidor Dell C6220 com 4 nós, ocorre de tempos em tempos que todos os 4 nós são desligados. Parece acontecer quando há uma leve flutuação de energia (apesar de haver um no-break em ambas as fontes de alimentação, na verdade 2 UPS diferentes para as 2 PSUs).
Existem 5 outros servidores nas mesmas UPSes (outros modelos, não C6220), nenhum dos quais desativado naquele momento.
A mensagem no log do sistema é:
2018/01/31 12:21:10 System ACPI Power State Sys Pwr Monitor S5/G2: soft-off
É impossível ligar qualquer um dos nós com o botão de energia ou via software. A única maneira de ligá-los novamente é remover os cabos de energia de AMBAS unidades de fonte de alimentação e conectá-los novamente.
Este é o mesmo comportamento descrito na postagem aqui no fórum da Dell , no entanto, não há resposta / solução nesse post.
Existe alguma maneira de evitar isso? Qual é a razão para esse comportamento? Nenhum dos meus outros servidores foi desligado. Evidentemente, havia um pequeno problema de energia (possivelmente 0,5 segundo de desligamento), mas com 2 UPS separados eu esperaria que pelo menos um deles não tivesse enviado a queda de energia para o servidor, mesmo que um deles estivesse com defeito.
Existem várias opções de configuração de energia na C6220. Aqui está como eles estão definidos:
Power Management <NodeManager>
Chassis Power Management > Chassis PSU Configuration
Required Power Supplies: 1
Redundant Power Supplies: 1
Power Capping
Chassis Level Capping: Enabled
Emergency Throttling
Sled Level Policy: Chassis Level
Chassis Level Policy: Throttling
Essas configurações são as mesmas nos quatro nós.
BIOS versão 2.5.3
BMC versão 2.59
Tags dell dell-poweredge