Eu acho que collectd pode atender às suas necessidades, especialmente no EC2, já que você pode adicioná-lo à sua base AMI e ele será enviado dados para (um ou muitos) coletor (es) central (es).
Dessa forma, novas instâncias começam imediatamente a enviar dados para você e você nem sempre ajusta seu sistema de monitoramento com adicionar / remover.
Use o grafite para coletar os dados e um simples script nagios setup ou cron job para verificar os valores que estão fora do ' norma.'
A partir dessa base, você pode crescer facilmente.