A verificação manual de alterações é para Sysadmins Menores. Real BOFHs Automatize.
Todos os nossos sistemas são abrangentes (e eu significam de forma abrangente; até pequenos detalhes niggly como "são todos os NICs neste sistema atualmente rodando na velocidade Gigabit"), e todas as nossas alterações terminar com "garantir que o monitoramento seja claro no momento X" (em que "tempo X" é "fim da janela de manutenção menos o tempo de reversão estimado mais um fator de correção porque tudo leva mais tempo do que o esperado, até mesmo reversões").
Se, por algum motivo, a parte do nosso sistema que está sendo alterada não for monitorada de forma abrangente, o primeiro passo do plano de mudança é "melhorar o monitoramento" (com uma lista detalhada do que precisa ser monitorado, como, por que e detalhes das maneiras pelas quais a documentação de resposta de monitoramento precisa ser melhorada para corresponder).
Os benefícios disso são vários:
- Nós não temos que gastar tempo verificando as coisas à mão, porque tudo está sendo constantemente monitorado por nós
- Não há chance de alguém cometer um erro na verificação ou falar uma mentira sobre se testou tudo
- Todo esse monitoramento para garantir que as alterações não quebraram nada também nos certifica de que sabemos sobre os problemas durante a operação - qualquer coisa que possa quebrar durante uma mudança quase certamente pode quebrar no dia a dia, por isso é bom saber sobre esse tipo de coisa todo o tempo.
Um plano simples para ir da linha de partida para a utopia totalmente monitorada é simplesmente configurar uma infraestrutura de monitoramento e, para cada plano de mudança, dar o primeiro passo "configurar o monitoramento para os serviços que eu vou mudar". Configurar isso não demora muito mais do que escrever e executar um plano de teste abrangente de qualquer maneira , e os benefícios são de longo prazo (esse monitoramento é constante e para sempre, e da próxima vez que você precisar mudar alguma coisa lá você economiza o tempo de escrever e executar outro plano de teste).