Como monitorar um servidor HP-UX para problemas específicos de hardware ou sistema operacional

2

Já passou algum tempo desde a última vez que lidei com um servidor HP-UX. Portanto, minha memória não é muito recente e quero consultar a sabedoria pública para isso.

Eu tenho uma tarefa em mãos para criar um critério de monitoramento mensurável para servidores HP-UX, específico para este SO (versão 11.X em que X pode ser 0, 11, 11i, 23 ou 31) e específico para HP hardware. As regras gerais de monitoramento são definidas por padrão, como se a utilização da CPU estivesse acima de 95% ou a utilização do disco estivesse acima de determinado limite ou se alguém tentasse, sem sucesso, efetuar login em algumas contas não autorizadas. Essas e outras condições são válidas e triviais para monitorar qualquer sabor do UNIX. Eu não estou interessado naqueles. Estou interessado em coisas que podem invadir o HP-UX e passam despercebidas, a menos que alguém as procure especificamente. Um exemplo:

if [ $(ioscan -fn | grep NO_HW | wc -l) -gt 0 ]
then
  echo "One or more device(s) went missing"
fi

Isto é muito simples, eu sei. Simplicidade é a razão pela qual eu consigo lembrar. Além disso, como ioscan não está disponível em nenhum outro tipo de UNIX, ele é muito específico para o HP-UX.

Deve haver outras coisas que você pode monitorar apenas no HP-UX e eu quero compilar uma lista de tais critérios. Como qualquer processo crítico, mas não óbvio, que precisa ser executado o tempo todo, vem à mente. Também lembro de algumas strings mágicas que você poderia alimentar para o comando stm ou cstm , para saber sobre sua CPU, memória ou outro hardware.

Se você tem comandos esotéricos e está disposto a compartilhar, seria muito apreciado.

    
por Scott 12.08.2016 / 20:44

0 respostas