Eu finalmente encontrei a causa do problema.
Eu tinha um aplicativo web flask, que usa redis para transmitir eventos para o usuário. Quando o usuário desconectou, o aplicativo manteve viva a conexão do pubsub do redis, sem ler mais os dados.
Isso leva a um longo Send-Q
/ Recv-Q
, que aparentemente faz com que a pilha tcp fique lenta e produza avisos de kernel:
" TCP: sem memória - considere ajustar tcp_mem ".
- Correção de curto prazo: elimine os processos com as longas filas de pacotes.
- Solução a longo prazo: Corrigindo os programas que se comportam mal.