Então, isso parece um problema de relatórios de monitoramento e capacidade. Se você vai começar a medir as estatísticas de tendências, eu vou em frente, para que você possa comparar, correlacionar, etc.
Em termos de ferramentas, você tem gânglios, zenoss, nagios, etc. no mundo opensource e vários outros produtos de fornecedores.
Você pode configurá-los para rastrear, medir e armazenar os KPIs nos quais está interessado e, em seguida, informar sobre eles periodicamente.
Devido a suas consultas sobre o uso de RAM, faria sentido incluir também as estatísticas de memória, uso de troca e CPU, para que você possa compará-las no mesmo período de tempo e ver quais estão sendo limitadas etc.
Uma vez que você está capturando dados, você pode armazená-los todos em um grande banco de dados para relatórios, possivelmente rarificando dados históricos, por exemplo. armazene cada métrica de 5 segundos durante 6 meses, depois por minuto, depois 5, depois por hora, à medida que avança. Esse tipo de coisa pode ser roteirizada e executada através do cron, autosys etc.
Esses relatórios lhe darão o que a gerência deseja - por exemplo. algo com gráficos bonitos.
E para o gerenciamento diário, você pode ver informações em tempo real em um gráfico / figuras no console para ver como está se saindo em determinado momento.