Conduza com segurança testes que exijam desconexão do servidor

2

Então, basicamente, estou testando e diagnosticando meu UPS, bem como as fontes de alimentação (PSU) do meu servidor. Para esse propósito estou desligando o servidor "da maneira mais difícil", desconectando-o da parede para simular uma perda de energia.

Isso eu tenho feito da maneira descrita, e me ajudou a descobrir quais UPSs não estão funcionando corretamente, assim como o que a PSU precisa mudar (se o servidor desligar, algo precisa mudar, então tudo está ok). No entanto, estou começando a me preocupar que desconectar meu servidor constantemente e "matá-lo" da maneira mais difícil pode causar algum dano a ele ou aos meus dados.

Isso me leva à minha pergunta: Existe uma maneira alternativa de realizar esses testes para minimizar as chances de danificar o servidor ou suas partes? Ou não há problema em fazer o que eu sou atualmente. fazendo?

Mais uma vez, estou tentando determinar quais fontes de energia estão com defeito (isto é, o UPS está ok, mas o servidor morre de qualquer maneira quando desconectado). Os no-breaks podem testar sozinhos como para evitar tentar esse método com o servidor, mas não consigo descobrir como testar se os meus PSUs conseguem lidar com flutuações e picos sem realmente testá-los em um servidor ativo. Qualquer orientação é muito apreciada.

O servidor em questão : servidor HP ProLiant DL380 G7 , com Intel Xeon . Eu também tenho isso com o nível RAID 1 em seus HDDs. Tem Ubuntu 16.04.3 LTS rodando em seus SSDs.

    
por DarkCygnus 31.01.2018 / 02:26

3 respostas

2

Você tem um HP ProLiant DL380 G7 . Veja o seguinte:

O Systems Insight Display (SID) mostra a saúde dos componentes internos.

Sevocêtiverumaluzâmbaremqualquerumadasfontesdealimentação:mostradanoSIDounasunidadesfísicasreais,háumproblema.

VocêtambémpodeefetuarloginnoILOdoservidorparaverificarologdegerenciamentointegrado.Sevocêperderaenergiaderepente,podehaverumaentradanologindicandoalgocomo:

-Serverreset.-Serverpowerremoved.-Serverpowerrestored.

Vocêtemaopçãodenãoconectarasduasfontesdealimentaçãoaomesmono-break.Conecteumàredeelétricaeobserveocomportamento.

Verifiqueofirmwarenoseusistema.OsservidoresG7jáestãovelhos,masaoexecutaroUbuntu,vocêprovavelmenteestáperdendoosagentesderelatórioegerenciamentodaHP(elessãootimizadosparaRHEL/CentOS/VMware/Windows).Vocêpodefazerodownloaddoconjuntocompletodefirmwareparaestemodelousando este DVD inicializável da HP .

    
por 31.01.2018 / 14:35
1

Não desconecte seu no-break da parede. Eu fiz uma pergunta semelhante há 9 anos neste site e recebi a seguinte resposta de Anderson Anderson :

The UPS is losing its electrical ground when you unplug it from the wall. While it's unlikely that anything would go wrong, the UPS designers "expect" that path to ground to remain available at all times, and if something did short during your test you might see sparks (smoke, flame, etc) when the electricity takes another path to ground. I've unplugged UPSs from the wall for testing before, but seeing a flash of "lightning" and hearing a loud "bang" coming out of a UPS during one such test gave me "religion" about not doing that again.

Portanto, se você estiver em uma tomada comutada, desligue-a. Se você não estiver em uma tomada comutada, considere colocar a energia no disjuntor para que o circuito de aterramento permaneça conectado.

Quanto a desconectar seus servidores puxando os plugues, você não deve causar nenhum dano físico às máquinas fazendo isso. Você pode corromper matrizes RAID não suportadas por bateria ou interromper gravações em andamento, o que pode causar sistemas de arquivos confusos e perda de dados, mas seus servidores físicos devem estar bem.

Quanto ao seu problema atual , que é que durante quedas de energia / blackouts / surtos você ainda perde seus servidores a montante de seu UPS, há algumas coisas que podem causar isso:

  1. Se você tiver duas fontes de alimentação em seus servidores e uma delas estiver na UPS e uma não estiver (o que é bastante comum), você pode ter uma falha na comutação da PSU dentro do servidor
  2. Novamente, se você tiver duas fontes de alimentação, talvez uma delas esteja sobrecarregando e o servidor esteja sendo desligado por motivos de segurança
  3. Dependendo do tipo de UPS que você possui, pode não estar mais funcionando corretamente. Eu tive um site uma vez que tinha quedas de energia constantes - 20 a 30 vezes por dia a energia cairia abaixo de 200v (normalmente 230v) e o no-break entraria em modo de reforço, e às vezes a voltagem aumentaria para 250v e o no-break entraria em economia modo. Isso reduziu drasticamente a vida útil do no-break tradicional (eu normalmente ficava um ano fora do no-break). Mudamos para um no-break de dupla conversão (também chamado de UPS on-line) que resolveu esse problema.
por 31.01.2018 / 14:12
1

Duas notas:

Uma é que a melhor maneira de conectar o no-break é através da fonte de alimentação dupla de seus servidores. Se a energia ou o no-break (bateria) falharem, tudo permanecerá ativo.

Segundo: exceto pelo que foi dito sobre perder terreno, não é ruim desconectar um servidor (se você não se importa com a corrupção de dados), exceto o SSD . Dependendo de quais SSDs você possa ter, pode ter um super capacitor para lidar com isso. Mas, perder energia pode danificar blocos que estão sendo apagados ou gravados.

Edite sobre a fonte de alimentação dupla: a maneira correta é uma fonte de alimentação na parede, a outra fonte de alimentação através do no-break. Errado seria conectar apenas uma fonte de alimentação ou conectá-los através do no-break. Se você o fizer, falhas no autoteste da UPS interromperão a alimentação e você não poderá desligá-lo para substituir a bateria.

Claro, não se tem esse luxo com servidores sem PSU dupla.

    
por 31.01.2018 / 14:55