Como configurar o UPS para reiniciar servidores na seqüência correta?

12

Aqui temos alguns servidores e quase cada um deles tem um UPS dedicado. Existem dependências entre eles para que eles sejam ligados na sequência correta. Por fim, estamos tendo sérios problemas com a fonte de alimentação, portanto, os servidores são desligados e, em seguida, reiniciados em uma ordem aleatória quando a energia é restaurada. Não é um problema se os servidores foram desligados durante um blecaute, é importante que eles funcionem corretamente, sem qualquer intervenção humana, uma vez que a energia é restaurada.

Nossos no-breaks são baratos e o único parâmetro de configuração útil para minha meta é power the load xx seconds after power is restored . Em teoria, colocando os atrasos certos em cada no-break, posso consertar a ordem de reinicialização do servidor, mas não confio em que o no-break se comportará como esperado.

É o caminho certo a seguir?
UPS de alto nível dá outras opções para consertar a sequência de reinicialização?
Uma nota final: meus ups estão na faixa de 1000 - 2200 VA

    
por Filippo 08.06.2016 / 08:23

4 respostas

25

A resposta padrão para isso é "não em todos". Corrigir o software para manipular reinicializações em ordem aleatória. Se você realmente precisar de ALGUNS servidores para iniciar primeiro (por exemplo: Active Directory), coloque-os em USVs que possivelmente sobreviverão muito mais. Um servidor baseado em átomos de baixa potência é suficientemente bom como controlador do Active Directory e sobreviverá um dia em um pequeno USV.

Do high level UPS give other options to fix the restart sequence ?

Não. Eu diria que é geralmente assumido que os programadores são competentes o suficiente para contornar o problema apropriadamente.

O que você poderia fazer é:

  • Os servidores iniciam "aleatoriamente". Exceto para DHCP / Active Directory, não há nada realmente exigindo uma ordem que não possa ser corrigida.
  • Ter um servidor de controle após algum tempo (5 minutos) iniciar os serviços nas várias máquinas na ordem correta.

Eu diria que esse tipo de configuração é muito mais comum. Eu chamaria qualquer software que REQUIRE o servidor inicia em uma ordem específica (fora da infraestrutura pura) como quebrado e impróprio para os negócios.

Apenas como nota: nossa configuração é um USV de baixo custo de 20kva (baixo custo porque temos um usado) para os servidores, com um USVA de 2000VA escravo para uma máquina que serve como "raiz" da rede (e máquina de backup) . Slaved significa que o USV está por trás do grande - então ele só muda para bateria quando o grande (que dura entre meia hora e 8 horas dependendo de quanto de nossa grade de computação está on-line) está indo para o desligamento do terminal. p>     

por 08.06.2016 / 08:49
14

As Unidades de distribuição de energia gerenciadas (em vez do no-break) geralmente suportam atrasos personalizados na ativação de tomadas individuais depois que a energia é retomada .

Normalmente, isso impede que os disjuntores disparem quando um gabinete cheio de sistemas é acionado ao mesmo tempo imediatamente após a energia ser restaurada, mas isso também pode ser usado para preservar a ordem de inicialização de suas dependências do sistema.

    
por 08.06.2016 / 09:41
6

Eu tive esse problema exato. A única diferença é que investimos em unidades de energia APC montadas em rack resistentes (por exemplo, APC SmartUPS 3000 ). Com o software de encerramento de rede APC PowerChute ( software PowerChute Network Shutdown) , Posso desligar e ativar servidores em uma ordem específica. Outro recurso útil do software era configurar os servidores para desligar no último minuto, ou seja, calcular o quanto de energia da bateria as unidades da APC tinham deixado e desligar os servidores com tempo suficiente para desligá-los adequadamente, em vez de simplesmente desligá-los.

O software não é amigável, mas não é nada difícil se você dedicar algum tempo para descobrir. Se você estiver interessado em investir mais em sua infraestrutura, esse é definitivamente o caminho a percorrer.

    
por 08.06.2016 / 16:00
2

Parece que as unidades UPS são de baixo custo e não podem ser configuradas para um tempo de espera de saída específico depois que a energia é restaurada (algumas unidades de extremidade superior são). Para obter a mesma funcionalidade, você precisa escolher um host específico para ligar sempre (talvez qualquer sistema que possa ser inicializado a qualquer momento) e deixar todos os outros servidores em um estado desligado (configurado no BIOS para retornar à energia quando AC é aplicado, e para honrar o pacote mágico Wake On Lan para ligar quando solicitado a fazê-lo). Então, no host principal que inicializa, execute um script / utilitário para cronometrar a transmissão do pacote mágico WOL para cada host.

    
por 08.06.2016 / 20:21

Tags