Temos uma árvore de rede de escritório simples construída em diversos switches ProCurve L2 e L3 GigE que abrangem cerca de 300 portas. Hoje, descobri que um dos dispositivos na rede por um curto período de tempo causa uma transmissão excessiva que causa saturação na maioria dos links de 100 Mbps que afetam determinados serviços, como o VoIP. O dispositivo é conectado ao switch ProCurve 3500yl, que é o switch raiz da rede e, portanto, a tempestade transborda por meio do switch raiz para o restante da rede.
P: Existe uma maneira de localizar o problema e evitar que a tempestade se espalhe pelo switch raiz?
Aqui estão alguns detalhes mais específicos do meu caso que podem ser relevantes, pois posso estar fazendo uma pergunta errada e a melhor solução pode estar em outro lugar.
O dispositivo que provoca a tempestade é ele próprio um switch PoE ProCurve 3400cl (J4905A) com uma versão de firmware desatualizada M.10.76
de 2009. Eu sei que é antigo, irá mostrar o mais recente no fim de semana .
O 3400cl está conectado a uma fonte de energia com interrupções prolongadas e intermitentes. Quando a energia é retomada após uma interrupção, o dispositivo demora cerca de 5 minutos para inicializar. No momento, o tráfego flui pelo dispositivo enquanto o dispositivo e seus links ainda não estão completamente configurados. Durante esse tempo, ele gera na rede todos os tipos de tráfego indesejado que são difíceis de capturar, mas que deixam um pico nas estatísticas coletadas sobre o SNMP.
Durante esse tempo, vejo High collision or drop rate. See help.
mensagens em muitas portas de 100Mbps na rede.
O 3400cl é conectado por dois links físicos do GigE a 3500yl. O 3400cl está executando o RSTP enquanto o 3500yl está configurado com o protocolo de árvore de abrangência MSTP. Durante a operação normal, um dos links é desabilitado pelo RSTP em 3400cl enquanto o outro está encaminhando.
Quando o 3400cl reinicializa, posso ver as seguintes mensagens nos registros do 3500yl
14:05:03 ... port 37 is now off-line
14:05:04 ... port 38 is now off-line
14:05:51 ... port 37 is blocked by STP
14:05:51 ... port 38 is blocked by STP
14:05:54 ... port 37 is now on-line
14:05:54 ... port 38 is now on-line
e depois estou vendo High collision or drop rate
em portas de 100Mbps conectadas a 3500yl e os switches de nível inferior conectados a ele.
14:07:11 ... port NN-High collision or drop rate. See help.
Além disso, os usuários de VoIP estão passando por interrupções.
A única medida imediata que eu poderia tentar foi definir broadcast-limit 5
no par de portas 3500yl. Não tenho certeza e não pude testar se isso ajudará. Também se parece muito com uma solução ad-hoc .
Tags hp-procurve flooding