Como verificar se uma reinicialização foi devido a falta de energia?

3

Tivemos problemas com o disparo de um disjuntor e acho que fizemos isso de novo, mas preciso confirmar que 1 de nossas caixas foi reinicializado devido a uma queda de energia e não por outro motivo mundano.

Eu obtive as seguintes informações dos registros, mas me pergunto se há algo mais revelador:

Approx time of restart:
May 19 19:54:57 atlas07 

$ last
davidpar pts/0        10.1.2.12        Sun May 19 19:54   still logged in
reboot   system boot  3.5.0-30-generic Sun May 19 19:44 - 20:19  (00:34)
davidpar pts/0        10.1.2.83        Tue May 14 04:14 - 04:21  (00:06)
...


$ tail -n 500 syslog
<cut>
May 19 19:44:58 atlas07 ntpdate[1489]: adjust time server 91.189.94.4 offset 0.000047 sec
May 19 19:45:04 atlas07 CRON[1492]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
May 19 19:54:57 atlas07 dbus[1012]: [system] Activating service name='org.freedesktop.ConsoleKit' (using servicehelper)
May 19 19:54:57 atlas07 dbus[1012]: [system] Activating service name='org.freedesktop.PolicyKit1' (using servicehelper)
May 19 19:54:57 atlas07 polkitd[1565]: started daemon version 0.104 using authority implementation 'local' version '0.104'
<cut>
    
por David Parks 20.05.2013 / 05:25

2 respostas

4

O último comando exibirá falha no horário final de uma sessão se o desligamento não estiver limpo, o que incluiria uma queda de energia. Exemplo de entrada:

myuser pts/1        myhostname  Wed Sep 28 14:18 - crash  (00:23)

Olhando para as suas últimas entradas (assumindo que são todas elas) não há falhas listadas lá, então nenhuma falta de energia ocorreu enquanto este sistema estava ligado. A reinicialização listada aqui parece ser uma reinicialização comandada e não uma falha. Se você não reinicializou manualmente esta caixa, você fez um programa com acesso root.

    
por Fred Thomsen 20.05.2013 / 05:49
2

Suas caixas não estão conectadas à UPS? Se você fizer isso, geralmente há um registro e suporte para isso e você verá claramente quando a energia está diminuindo no no-break e quando o servidor está em queda devido ao desligamento seguro dos altos-circuitos. Talvez você esteja interessado nessa questão: link

Quando não há UPS, é difícil "gravar um log" quando não há energia. Isto é impossível. Você pode encontrar falta de energia indiretamente para cortar outras razões.

Eu recomendo monitorar todos os parâmetros importantes de suas caixas para decidir o que está encerrando seu sistema. Pode ser uma falha de componente como mainboard ou memória (normalmente alguns bluescreens / mem michmatched), ou CPU e ventiladores (o superaquecimento acaba no desligamento), ou erros HDD r / w (clusters ruins em recursos do sistema), cada um tem alguns sintomas típicos.

Procure em / var / log / syslog /var/log/kern.log se houver algo interessante.

A falta de energia pode ser gravada no BIOS do sistema. Você pode tentar ler o registro do BIOS do sistema, se houver algum, mas seria elaborado, pois cada servidor é diferente dessa maneira. Mas isso não será necessário dizer o que está acontecendo e qual é a razão de "servidor desligar". Tente o comando dmidecode para obter detalhes do BIOS, mas duvido que exista um log.

ou .. se você não quiser investir na UPS, você pode pelo menos monitorar a linha de energia via notebook no local (tem baterry e pode ler e registrar o status do gerenciador de energia) tentar logar um adaptador grep ' 'de acpi -V , como deveria escrever algo como Adapter 0: on/off-line

acpi -V |grep 'Adapter'
    
por Dee 20.05.2013 / 05:52