Atualmente, estou usando o Rastreador de solicitações ( link )
Todos os eventos de manutenção recebem um ticket associado na fila de "sistemas". Notas sobre problemas encontrados, quem fez o trabalho quando, etc. são todos inseridos no ticket, junto com as aprovações necessárias.
No momento, nossas tarefas recorrentes (patching trimestral etc.) são criadas manualmente, mas podem ser automatizadas com facilidade (cron job + email).
Coordenar quem está fazendo o trabalho é relativamente fácil para nós, pois há apenas duas pessoas em nosso grupo de administradores, mas à medida que ampliamos o plano é criar um ticket mestre para eventos de manutenção & usar tickets filho atribuídos aos responsáveis para delegar o trabalho.
O material diário (verificações de registro, etc.) é outro assunto: tenho tudo isso relacionado a processos automatizados:
- O InterMapper mantém um olho no status geral dos servidores (consultas SNMP à procura de carga alta, pouco espaço em disco etc.), funcionalidade de nosso site interfaces e várias outras coisas que podem indicar problemas.
- O Syslog-NG coleta logs de nossos hosts & alimenta-os através de um monte de scripts que verificam a maldade óbvia. Eu olho para os logs ocasionalmente para verificar os scripts, mas isso não é agendado regularmente.