Eu uso o Nagios e ele tem plugins para todos os tipos de serviços que ele pode monitorar. Também funciona com limites. Aqui está um exemplo de um plugin que pode monitorar as temperaturas de um HP Proliant: Check_hpasm
Eu não tenho muita experiência em trabalhar com servidores e preciso monitorar temperaturas para vários servidores (remotamente). Eu uso o hwmonitor para meus laptops, mas ele não suporta hardware de servidor. Alguém sabe de algo que vai funcionar?
Adoraria algo que enviará notificações quando determinadas condições / limites forem atendidos, mas não necessários, pois eu posso conectá-los remotamente e verificar periodicamente.
Eu uso o Nagios e ele tem plugins para todos os tipos de serviços que ele pode monitorar. Também funciona com limites. Aqui está um exemplo de um plugin que pode monitorar as temperaturas de um HP Proliant: Check_hpasm
Se você precisar monitorar um único servidor, pode tentar com SpeedFan ou RealTemp que funcionam também no sistema operacional padrão, para monitorar o servidor a partir de nagios de consolle centralizados ou solarwinds são mais adequados.
eSensors têm pequenos dispositivos de hardware que podem monitorar a temperatura da sala do servidor. Esses dispositivos podem ser monitorados pelo Nagios, pelo Monitor do servidor PA e outros.
Isso está falando para servidores HP, mas imagino que outros fabricantes façam um tipo semelhante de coisa.
Quando configurado, o servidor pode expor as informações do sensor térmico usando o SNMP. Entre outras coisas, ele irá expor as temperaturas da CPU, temperatura ambiente geral, juntamente com os limites de desligamento térmico para cada sensor. Você pode monitorar e representar graficamente os valores atuais de temperatura e desligamento térmico e configurar alertas com seu software de monitoramento favorito. Pessoalmente eu uso o Nagios e o Cacti para fazer isso, mas qualquer software de monitoramento meio decente permitirá que você faça isso com relativa facilidade.
Além disso, os agentes do HP Insight instalam serviços no Windows que podem enviar e-mails quando ocorrem todos os tipos de eventos. Isso inclui alertas térmicos, mas também coisas como discos rígidos mortos, PSUs, fãs, então vale a pena gastar 5 minutos configurando isso (sério, é literalmente entrar em um servidor de email, alertar destinatários e eventos para alertar cada destinatário e pronto) .
Se você usa unidades UPS da APC, ou outras que possuem módulos para redes e sensores externos, esse é um caminho muito bom.