No trabalho, temos dois ambientes com perfil de nova relíquia. Implementamos os mesmos contêineres de estivadores para o dev e a produção. O que é interessante é que, enquanto o dev não está tendo problemas, o site de produção continua em queda.
A diferença entre os dois ambientes é que o dev não rouba tempo em seus servidores aws, enquanto a produção o faz. Observamos um aumento no tempo de CPU roubado logo antes do servidor node.js travar.
Pelo que eu li, o processo deve apenas esperar, mas há situações em que esse tempo roubado irá realmente travar o servidor?