Antes de mais nada, peço desculpas se essas perguntas parecem genéricas demais. Eu procurei neste site e em alguns outros e realmente não obtive as respostas que estava procurando.
Desde a migração para um novo ambiente virtual, temos sido afetados por problemas. Parece que todo dia é outra coisa. De blocos de firewall corporativos para o disco tmp, preenchendo e fechando serviços. Parece que há um novo problema todos os dias, o que significa que eu grito todos os dias.
Eu disse ao meu chefe que não posso prever o futuro, e saber o que esse firewall fará ou quem terá a lista negra, etc. Eu disse a ele que faria o melhor que pudesse para me preparar para esse tipo de problema. vez que algo sai do campo esquerdo, na maioria das vezes não tenho como consertar até que o problema se apresente.
Meu chefe é um tipo de "grande figura". Se uma coisa está quebrada, então a coisa toda está quebrada. Eu fiz o meu melhor para explicar a ele que nem sempre vejo problemas, mas eu faço o meu melhor para monitorar nosso servidor e cuidar das coisas que eu conheço.
Aqui está uma lista de coisas que fiz para garantir o funcionamento do nosso servidor:
Há mais alguma coisa que eu possa fazer para evitar preventivamente o tempo de inatividade e outros problemas?