Muitos aplicativos podem fazer log no syslog, o que significa que você pode obter os logs em um servidor de log. apache, mysql, tomcat (log4j) pode, pelo menos.
Então você precisa de um servidor syslog competente para fazer a agregação. Eu uso o syslog-ng, mas isso é porque foi a única alternativa séria 7 anos atrás. O Debian Lenny mudou para o rsyslog, que provavelmente tem uma base de código mais segura e ainda mais recursos.
Na minha experiência, um bom mecanismo regex é a parte mais importante de um servidor syslog agregado. Há tanto gorp que você quer filtrar para poder ver as partes relevantes. Você também pode apontar o logwatch nos logs agregados se quiser começar rapidamente.
EDIT: eu deveria ser explícito. Nossa estratégia é registrar tudo de um host específico para um ou mais arquivos em uma pasta para esse host e, simultaneamente, fazer login em arquivos altamente filtrados que registram determinadas atividades em todos os hosts. Por exemplo, pode haver um arquivo com logins com falha em todos os hosts.