Embora não seja a resposta direta "aqui está o problema" que você esperava, aqui está minha sugestão.
Parece que, apesar de nobre, sua busca para descobrir o que está errado não será resolvida rapidamente por você.
Você pode fazer como outras pessoas sugeriram e tentar registrar tudo o que puder e esperar que um padrão surja.
Eu gosto da sugestão de derobert de contratar alguém para medir a qualidade da energia ...
No entanto, aqui está a minha sugestão real que você já fez um pouco. Deixe para os eletricistas.
Sério. Um eletricista qualificado (mesmo que você precise terceirizar) deve ser capaz de lhe dar a causa raiz SE é de natureza elétrica ou não. Eles podem testar cada circuito para se certificar de que não estão sobrecarregados (especialmente em picos / partidas), eles podem se certificar de que a fiação é adequada e os circuitos são dimensionados adequadamente para o que você está anexando a eles. etc etc.
Na maioria das vezes, a TI não tem seu próprio eletricista qualificado e muitas vezes gostamos apenas de "plugar coisas" e não percebemos se estamos usando os circuitos certos, equilibrando circuitos, etc.
Se o seu UPS suportar coleta de logs, eu o farei, se nada mais, para ajudar a comprovar o problema. Embora seu no-break possa não ser de alta qualidade o suficiente para compensar os picos / vales de forma adequada (rápida) o suficiente, isso não significa que seja a causa principal. Soa como um problema elétrico para mim. Se você está executando um bom on-line UPS e parece estar compensando a tensão de entrada corretamente (com base em seus registros), então seria estranho que todos os equipamentos de TI conectados a ele e o sistema de leitor de cartão fossem reinicializados ao mesmo tempo .
Fale com seu chefe e explique a questão em termos de precisar de um eletricista experiente para diagnosticar. Não é justo esperar que um eletricista configure o roteamento BGP e, inversamente, não espere que um administrador de sistema seja um eletricista qualificado.