Eu tenho uma caixa Linux (em execução no AWS EC2 com o Linux AMI padrão) e depois de um tempo ele para de aceitar qualquer conexão de entrada. Como estou executando no EC2, não há como acessar a máquina até que eu a reinicie. O EC2 também executa todos os tipos de verificações do sistema e eles parecem estar bem. Mas o tráfego http, https e ssl não é mais aceito.
A caixa está executando o Docker com 1 NGINX e 5 contêineres NodeJS idênticos (para diferentes regiões). Alguém tem alguns indicadores que métricas devo olhar? É uma instância t2.small (1 CPU com 2GB de RAM).
O host do Docker não faz nada, apenas serve os contêineres. Mas eu acho que se um contêiner consome todos os recursos, a máquina cai completamente.
Eu já configurei um monitoramento do CloudWatch que monitora:
E para cada processo NodeJS, monitorei:
Parece assim:
As minhas instâncias do NodeJS parecem bastante pesadas (> 1GB de memória), mas não há nada de especial. Apenas algumas conexões com alguns serviços da AWS (DynamoDB, S3, ...) e algumas chamadas REST leves.