Ligação automática após desligamento normal no no-break

7

Esta é minha configuração básica:

  • Eu corro um servidor (DL380 G7; kernel linux 3.13) que hospeda ~ 10 máquinas virtuais
  • Está definido para ligar automaticamente
  • eu uso o NUT para gerenciamento de UPS
  • A duração do desligamento normal do Anfitrião (incluindo a primeira desativação do VMS) é de ~ 8 a 10 minutos
  • O tempo de execução total do no-break (eu tenho 2, cada um alimentando uma PSU no servidor e uma PSU no armazenamento conectado) em baterias totalmente carregadas é de ~ 75 minutos.
  • Defina os níveis de UPS / NUT para que eu tenha o nível crítico (LOWBATT), ou seja, inicie o desligamento com 15 minutos restantes (não me atrevo a ir mais baixo)

O seguinte cenário que aconteceu comigo duas vezes nos últimos 12 meses:

  • Perda de energia, o UPS assume muito bem
  • A energia permanece desligada por cerca de 1 hora - > desligamento iniciado, como deveria ser
  • O servidor pára o vms, inicia o procedimento de encerramento
  • - > em algum momento aqui poder volta
  • O servidor conclui o desligamento e desliga
  • O servidor não volta a ficar online, já que o no-break tem energia (de novo) e o servidor nunca perdeu energia (sendo fornecido pelo no-break), então basicamente olha para o servidor como se tivesse sido um desligamento gracioso intencional.
  • Assim que me lembro, liguei remotamente o servidor via ILO [a última vez que isso aconteceu foi hoje às 03h46 :-), então é por isso que estou perguntando]

Como ewwhite apontou, os modelos de UPS específicos seriam úteis:

  • Eaton 5PX 2200VA, com +1 EBM
  • Roline Prosecure II, 1500VA RM2U, com +1 EBM

Algum de vocês se deparou com o mesmo problema? Existe uma solução pronta para uso com alguns UPSes?

Até agora eu considerei configurar algum dispositivo Linux de baixa potência (Raspberry Pi?) para assumir o monitoramento; ele verificaria as unidades ups por carga suficiente das baterias e status de energia de entrada e, em seguida, reiniciaria o servidor via ILO / IPMI.

Existe alguma solução automática que incomoda muito (no meu caso e em geral) e devo apenas fazer uma intervenção manual quando e se isso acontecer?

considera

martin

    
por martin 04.08.2014 / 14:34

3 respostas

1

Este é um caso em que você não deve estar usando duas unidades UPS , onde cada uma alimenta uma fonte de alimentação. Isso pode ser uma grande parte do seu problema, já que um no-break único pode restaurar o estado de energia anterior após uma interrupção (esse também é o padrão no BIOS HP ProLiant). Ter dois parece atrapalhar essa lógica.

Você está conectado ao no-break via cabo serial ou USB?

Veja as sugestões específicas em:
Como acordar um servidor depois que o UPS o desligar quando a energia da rede elétrica for restaurada?

Isso deve ser fácil de testar, mas, para ser sincero, passo muito pouco tempo lidando com esses casos extremos. O poder da sala do servidor é uma das coisas mais fáceis de planejar, pois você pode especificar x-horas de tempo de execução da bateria e ser capaz de navegar por cenários de perda de energia como este.

Se as interrupções forem maiores, apenas me certifico de poder fazer o remotamente e lidar com as coisas manualmente.

    
por 04.08.2014 / 14:50
1

Uma solução alternativa que não requer nenhuma alteração de hardware é configurar o processo de desligamento para reinicializar se o no-break tiver energia depois que todas as VMs tiverem sido desligadas. Isso envolverá descobrir onde, no processo de desligamento, você pode colocar seu script de inicialização e precisa certificar-se de que a porca não seja fechada antecipadamente, conforme necessário, para se comunicar com o no-break.

Você está enviando um comando de desligamento para o no-break no final do desligamento do servidor? Se não, você poderia considerar também a opção de fazer isso e então você pode definir o atraso até o desligamento, para que o seu servidor realmente termine o desligamento e também um tempo limite após o desligamento e até ligar o servidor após a energia voltar. Se a energia estiver de volta antes do encerramento ser concluído, você ainda terá seu servidor completamente desligado pelo comando de desligamento, mas ele será reativado depois de algum tempo limite.

Verifique o NUT upscmd shutdown.return e os tempos limite associados.

    
por 29.08.2014 / 11:37
0

Uma solução de gueto, mas funciona. Pegue um pequeno roteador mikrotik ou uma placa Linux, e coloque wake on LAN nele. Coloque o dispositivo sem backup ups, configure-o para enviar wake on LAN a cada minuto ou 30 seg. Então, quando perde energia, não envia comandos, mas quando recebe energia, envia WOL a cada 1m ou 30s. Portanto, o seu servidor nunca é desligado quando a energia está ligada.

    
por 23.10.2018 / 17:23