Monitorando PSUs com IPMI e Nagios locais

2

Eu gostaria de usar o Nagios para monitorar as PSUs redundantes em meus servidores (rodando o Debian Wheezy).

Eu executei o script sensors-detect no pacote lm-sensors e a única coisa que ele pode encontrar é

Driver 'ipmisensors':
  * ISA bus, address 0xca2
    Chip 'IPMI BMC KCS' (confidence: 8)

Eu, então, instalei freeipmi-tools e descobri que posso obter uma saída útil de ipmi-sensors :

$ sudo ipmi-sensors --group='Power Supply'
5: Power Supply 1 (Power Supply): [Presence detected]
6: Power Supply 2 (Power Supply): [Presence detected]
7: Power Supplies (Power Supply): [Fully Redundant]

Eu posso escrever um plugin do Nagios para executar ipmi-sensors localmente, analisar sua saída e alertar se ele muda, mas eu reluto em confiar no formato de saída que permanece o mesmo, e não consigo descobrir como obtenha mais resultados legíveis por máquina.

Eu olhei check_ipmi_sensor , mas parece funcionar apenas onde o dispositivo IPMI está disponível na rede; o meu não é.

Existe uma maneira melhor do que analisar a saída de ipmi-sensors ?

    
por Flup 29.08.2014 / 16:36

2 respostas

1

Existem vários outros plugins para o IPMI listados no Nagios Exchange. Este é (às vezes) um lugar melhor para começar a procurar do que o Google.

Por exemplo:

por 04.09.2014 / 16:57
-1

Não há razão para analisar os dados do IPMI. É preciso um thread de CPU para ler e um thread para analisar e se você estiver escalando para sistemas de tamanho de data center, milhares de servidores são muitos threads. Em vez disso, use uma API, java (Vrx ou Hemi) ou biblioteca C (ipmitool ou freeipmi) para acessar diretamente os dados da IPMI. Data Centers (40 k servidores) podem ler 6 milhões de sensores IPMI / minuto e a criação de threads se torna o fator limitante.

A vantagem de uma API é que erros de wirte de barramento IPMB, como no barramento está ocupado ou tem um erro de hardware permanente, e você pode decidir tentar recuperar os dados novamente.

    
por 29.08.2014 / 19:03

Tags