Desligamento inesperado com um registro de “Tecla liga / desliga pressionada”.

0

Meu servidor blade Supermicro se desligou com os seguintes logs. Qual seria a razão? (AFIK ninguém tocou!)

  • O uso da CPU foi de cerca de 50% nas poucas horas antes do incidente.
  • Esse problema aconteceu há algumas semanas nas últimas semanas, quando a carga era semelhante no sistema.
  • Não há entrada de alta temperatura (ou qualquer outra coisa) no log de eventos do BIOS.
  • Não há evento registrado no log do IPMI
  • CentOS Linux release 7.5.1804, kernel 3.10.0-862.6.3.el7.x86_64
09:04:30 hostname ***some event***
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Power key pressed.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd-logind: Powering Off...
09:30:52 hostname systemd-logind: System is powering down.
09:30:52 hostname systemd: Stopping Authorization Manager...
09:30:52 hostname systemd: Stopping Authorization Manager...
    
por user1507435 09.07.2018 / 17:57

1 resposta

4

A resposta mais óbvia é, claro, que alguém apertou o botão de energia. Possivelmente acidentalmente - por exemplo, se o botão liga / desliga for infelizmente sensível e alguém bateu levemente ao andar. Isso também pode acontecer com um botão de energia com falha (por exemplo, as molas estão gastas). Pressionamentos por botão de energia acidental podem ser ajudados pela criação de algum tipo de guarda Molly para instalar sobre o botão de energia.

Solicitar um desligamento normal de, por exemplo, o IPMI frequentemente também será registrado como botão de energia pressionado.

Outra possibilidade é o ruído (elétrico) fazendo com que o sistema pense que o botão liga / desliga foi pressionado. Certifique-se de que os fios do botão de energia estejam firmemente encaixados na placa (e o interruptor, se não estiver soldado) e verifique o roteamento do cabo para garantir que os fios estejam longe de qualquer coisa com consumo de energia grande / variável.

Se nada mais funcionar, você pode editar /etc/systemd/logind.conf e alterar HandlePowerKey para ignore (e depois reiniciar o systemd-logind). Isso deve impedir que o sistema seja desligado, mas isso significa que você não poderá usar o botão liga / desliga para iniciar um desligamento normal (o desligamento inadequado por 4 segundos, se houver, não pode ser desabilitado via systemd como é feito pelo firmware do sistema).

    
por 09.07.2018 / 20:17