Monitoramento pós-patching do Windows

3

Atualmente, fornecemos gerenciamento de patches como um serviço para um grande número de servidores. Historicamente, tivemos RDP de técnicos do tipo de camada 1 para cada máquina após a janela de correção para verificar se eles estão on-line. Estamos superando rapidamente esse método de verificação. Temos um sistema de monitoramento muito robusto que utiliza principalmente o SNMP. É capaz de ping, snmp, processo, serviço, monitoramento de tipo tcp port etc.

A minha pergunta é o que todos recomendam monitorar para garantir que um servidor Windows esteja on-line e não pendurado na reinicialização ou no desligamento? Estou hesitante em mudar a nossa política de confiar apenas no monitoramento até que eu esteja confortável que o clássico problema de atualização do Windows "pendente no desligamento" possa ser monitorado com sucesso. Por exemplo, quando um servidor corrige e trava durante a reinicialização, mas ainda está respondendo ao ping, e possivelmente certos serviços ainda fazem check-in via SNMP como em execução. Alguém configurou uma política de monitoramento capaz de alertar nesses cenários? Existem serviços, processos ou portas do Windows recomendados que eu possa monitorar? Os tipos de servidores executam a gama, por isso estou procurando por qualquer tipo genérico de processos do Windows que pudéssemos monitorar.

Qualquer ajuda é apreciada!

    
por floyd 18.11.2015 / 15:47

1 resposta

1

Sempre há uma chance de um servidor travar de modo a não ser detectado pelo sistema de monitoramento, independentemente do que você escolher monitorar. Posso sugerir que você monitore os componentes típicos, como disco, disponibilidade de rede, serviços principais (com base nas Funções instaladas em cada servidor individual), etc. A combinação desses deve ser suficiente para que, se um servidor trava, um dos componentes monitorados irá acionar um alerta.

    
por 18.11.2015 / 17:07