Isso soa como uma combinação de problemas.
No caso de um sistema individual ser reinicializado aleatoriamente, eu gostaria de substituir a fonte de alimentação no chassi por uma que fornecesse mais que o suficiente amperage para os componentes conectados (como você deseja que ele continue funcionando durante os períodos de pico de consumo de energia).
No caso de todo o rack ser reinicializado simultaneamente, eu verificaria um no-break inadequado como causa raiz ou possivelmente uma condição de superaquecimento devido a uma falha de CA no local do servidor.
Um curto intermitente no cabo de alimentação para o multi-toque também pode resultar no resultado de várias reinicializações que você descreve.