Sou desenvolvedor há muitos anos, mas não tenho muita experiência em ops, então peça desculpas se essa for uma pergunta nova.
Na minha empresa, executamos um serviço da web escrito em Java, baseado principalmente em um servidor da web Tomcat. Temos dois datacenters com cerca de 10 hosts cada. Os hosts são de vários tipos: Dababase, Tomcats, alguns processos java off-line, servidores memcached. Todos os hosts são Linux CentOS
Até agora, quando lançamos uma nova versão para produção, usamos um conjunto de scripts shell internos que copiam jars / wars e reiniciam os tomcats.
A empresa ficou ainda maior, por isso, tornou-se cada vez mais difícil operar tudo isso e tomar o código do desenvolvimento, passando pelo controle de qualidade, pela preparação e pela produção. Uma versão típica muitas vezes envolve erros humanos que nos custam tempo precioso. Às vezes precisamos reverter para o último bem conhecido e isso não é fácil para dizer o mínimo ...
Estamos procurando uma ferramenta, uma estrutura, uma solução que forneça o seguinte:
Alguém pode compartilhar sua experiência? Sugira algumas ferramentas?
Obrigado!
Tags java monitoring linux deployment