Estamos executando um aplicativo no JBoss EAP no RHEL 6.7 e estamos tendo um desempenho significativamente diferente em todo o cluster. Das 8 VMs, a maioria responderá a solicitações em ~ 200ms, mas uma ou duas terão tempos de resposta de 2 ou 4 segundos.
Investigando o problema, observamos a partir do vmstat que os servidores mais lentos relatam centenas de milhares de interrupções do sistema a cada 5 segundos, em comparação com alguns milhares nos servidores rápidos. Mudando para / proc / interrupts, vimos que as interrupções eram TLB Shootdowns. 100k a 200k deles a cada poucos segundos.
Eu fiz algumas leituras para entender o que são ( eu gosto mais desta descrição). Mas eu Não sei onde procurar em seguida. Por que as interrupções de TLB estão sendo emitidas?
Tags interrupts redhat