trabalho de código aberto / gerenciamento de processos / monitoramento / sistema de controle [fechado]

1

Estou procurando uma solução de código aberto para o seguinte:

Eu tenho trabalhos que precisam ser executados continuamente. Os trabalhos são aplicativos ou scripts. Se eles falharem, eles precisam ser reiniciados. Se eles falharem, digamos 10 vezes consecutivas ou dentro de um determinado período de tempo, digamos 1 hora, eles precisam ser cancelados e a notificação será emitida para um repositório central. Se os trabalhos começarem a aquecer (usando CPU ou memória, etc.), os avisos devem ser emitidos e depois mortos se ficarem muito quentes. Os trabalhos podem ser programados opcionalmente para serem executados somente durante determinadas horas.

Eu sei que deve haver código aberto, independente de plataforma, linguagem de alto nível (ou seja, implementado em python, etc.), soluções sofisticadas de serviço completo para isso, mas não tenho certeza do que procurar ou do que tal sistema é chamado. Eu fiz um monte de googling mas ainda não encontrei algo que faz tudo isso.

    
por Aaron Frantisak 20.07.2012 / 05:40

1 resposta

1

Supervisor (escrito em Python) fará a maior parte do que você quer sair da caixa. Ele pode ser estendido com os outros bits de funcionalidade usando a API XML-RPC.

    
por 20.07.2012 / 07:39