Sugiro usar netdata e definir a janela de tempo para um período mais longo. Acredito que o padrão seja a última hora, mas eu configurei meus servidores para manter 12 horas de dados.
A métrica principal que você pode usar é% de CPU por grupo de aplicativos versus tempo: