Acontece que o culpado foi outra coisa juntos. Pacote de relatório de erros do Ubuntu chamado Whoopsie. Veja como foi rastreado.
- O Mongostat mostrou um número anormalmente alto de falhas, o que significava que os dados não estavam disponíveis na RAM e que o mongo provavelmente estava atingindo o disco em todas as consultas.
- Em seguida, emiti o comando free do Linux. Isso não ajudou. Na verdade, engana ao reportar RAM livre. Veja aqui www.linuxatemyram. com
- O comando top também não funcionou e sempre mostrou que o maior uso de memória foi pelo mongo, que não foi superior a 20%. Por que o mongo não estava usando a memória restante?!
- Uma rápida pesquisa no Google por ferramentas de monitoramento do sistema / memória mostrou htop como favorito.
Aqui está a saída htop no servidor. link - imagem
Uma RAM enorme de 43,7% comido por whoopsie !! Um grande momento. Acontece que isso afetou os servidores de produção e de preparação, mas a preparação ainda sobreviveu até certo ponto. Mais algumas buscas no Google depois eu descobri que isso realmente era um bug no Ubuntu. link
Eu não achei que o whoopsie - daemon de submissão do banco de dados do Ubuntu - fosse necessário em meu servidor como um componente crítico. Fomos adiante e apt-get removeu os purgados os pacotes de todos os servidores.