Acho que precisaremos de mais informações para fornecer uma resposta útil. Por exemplo, você diz que "identificou o Spanning Tree Protocol do roteador cisco como a causa", mas normalmente os roteadores não participam da spanning tree, apenas os switches fazem isso. Quando você disse roteador, você realmente quis dizer um switch L3 (como um 3750)?
Em geral, o Spanning Tree apresenta um desempenho ruim em redes de alta latência, redes altamente congestionadas ou redes com problemas de confiabilidade / perda bem menores.
É difícil acreditar que você esteja realmente fazendo um loop, já que da sua descrição você só tem uma conexão entre dois escritórios. É mais provável que você tenha uma configuração incorreta, ou você tenha problemas com o circuito MPLS que está causando a queda de BPDU, colocando assim a spanning tree em estado de confusão.
Acho que para solucionar isso, você precisa descobrir quais dos seus switches são a raiz raiz da árvore de abrangência e documentar sua topologia de árvore de abrangência. Meu palpite é que, quando você fizer isso, você encontrará um problema claro, como dois switches que estão tentando ser a bridge raiz, uma spanning tree depth maior que 7, etc.
Você pode postar um diagrama da sua rede?