A maior coisa a observar são falhas de página. Na maioria dos sistemas Linux, executando
ps -o min_flt,maj_flt
fornece estatísticas acumuladas, mas o tempo real nem sempre é bom o suficiente. SAR é provavelmente o seu maior amigo quando se trata de verificar a saúde geral do sistema, incluindo memória, processador, rede, etc ... Confira a man page para sar com certeza. Mas para responder as falhas da página, execute:
sar -B
Verifique a coluna de falhas principais para qualquer coisa importante acontecendo. Algumas grandes falhas de página estão bem, mas muitas delas acumulando geralmente indicam que você tem um processo que está consumindo memória indiscriminadamente, ou você precisa aumentar a quantidade de memória física em um servidor.
Última nota, quando correr "free" para ver a quantidade de memória, certifique-se de adicionar de volta a quantidade de memória livre listada em buffers / cache de volta à sua memória total mostrada.