"Uma grande quantidade de servidores que não podem ser reinicializados aleatoriamente" - isso parece um problema. Nosso amigo Caos Macaco mataria você. Minha sugestão é seguir as melhores práticas e ser capaz de matar qualquer servidor a qualquer momento. Isso vai lhe poupar muita dor de cabeça.
Ter arquivos modificados localmente também pode ser muito trabalhoso. Como você tem muitos servidores, então você deve ter um software para gerenciar sua configuração (Chef, fantoche, ansible). Após a atualização, basta executar esse software para garantir que sua configuração não seja sobrescrita.