Obtenha status de energia sobre o ipmi do zabbix

3

Agora estou procurando uma maneira de monitorar um hardware de servidor, como ventiladores / fontes de alimentação / etc. O problema é que temos um ambiente muito dinâmico - os servidores são ligados / desligados automaticamente - até várias vezes por dia, dependendo da carga.

Eu criei tetmplates para nossos servidores supermicro (nós temos apenas 3-4 tipos deles, então eles são muito específicos) que contém verificação de velocidade do ventilador (0 significa que o ventilador está morto). No entanto, toda vez que eu desligo a velocidade do ventilador do servidor também é 0.

Então, estou pesquisando como obter o status de energia (ou qualquer outro indicador que o servidor esteja executando) por meio do ipmi para enviar um alerta do zabbix somente se o servidor estiver em execução.

Sobre o ipmi é desafortunadamente o requisito, porque nós monitoramos dessa forma alguns servidores que não temos acesso.

Gostaria de evitar escrever um script que execute algo como: ipmitool power status. O Zabbix tem uma integração ipmi amaizing, então eu gostaria de usá-lo tanto quanto possível.

O sensor ipmitool retorna:

root@virt1:~# ipmitool sensor
System Temp      | 28.000     | degrees C  | ok    | -9.000    | -7.000    | -5.000    | 75.000    | 77.000    | 79.000
CPU Temp         | 0x0        | discrete   | 0x0000| na        | na        | na        | na        | na        | na
FAN 1            | 8355.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 2            | 8355.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 3            | 8725.000   | RPM        | ok    | 400.000   | 585.000   | 770.000   | 29260.000 | 29815.000 | 30370.000
FAN 4            | na         | RPM        | na    | na        | na        | na        | na        | na        | na
CPU Vcore        | 1.144      | Volts      | ok    | 0.640     | 0.664     | 0.688     | 1.344     | 1.408     | 1.472
+3.3VCC          | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
+12 V            | 12.031     | Volts      | ok    | 10.494    | 10.600    | 10.706    | 13.091    | 13.197    | 13.303
DIMM             | 1.544      | Volts      | ok    | 1.152     | 1.216     | 1.280     | 1.760     | 1.776     | 1.792
+5 V             | 5.216      | Volts      | ok    | 4.096     | 4.320     | 4.576     | 5.344     | 5.600     | 5.632
+5VSB            | 5.056      | Volts      | ok    | 4.096     | 4.320     | 4.576     | 5.344     | 5.600     | 5.632
VBAT             | 3.232      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
+3.3VSB          | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
AVCC             | 3.280      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712
Chassis Intru    | 0x0        | discrete   | 0x0000| na        | na        | na        | na        | na        | na
PS Status        | 0x1        | discrete   | 0x01ff| na        | na        | na        | na        | na        | na
root@virt1:~#
    
por Yarik Dot 03.04.2014 / 21:08

2 respostas

1

Uma ideia pode ser consultar o sensor ON / OFF. É um sensor discreto, veja link há um exemplo de como analisar um estado de sensor discreto.

Se o sensor liga / desliga não for possível monitorar, você pode ler sensores de tensão analógicos, por exemplo, "+ 5V" (ou mais alguns sensores de voltagem). Se a tensão estiver próxima de zero, o servidor provavelmente está desligado (ou a fonte de alimentação falhou).

    
por 11.04.2014 / 10:18
1

Na instalação padrão do Zabbix 2.2, existem dois modelos: "Template IPMI Intel SR1530" e "Template IPMI Intel SR1630". Ambos contêm um item "Power", que consulta o valor do sensor "power", e parece ser o que você precisa. Se não, descreva o problema que você está enfrentando com esse sensor.

    
por 04.04.2014 / 10:25