Novo link MPLS interrompendo a rede - Spanning Tree Protocol

2

Temos uma rede simples de 2 escritórios. Isto foi previamente conectado via conexão em kilostream. Isso agora foi substituído por uma conexão MPLS usando roteadores Cisco.

Quando conectamos o MPLS à rede do escritório principal, a rede fica paralisada devido a um loop. Nós identificamos que o Spanning Tree Protocol do roteador Cisco como a causa. Nós desligamos este protocolo e tudo funciona bem.

Infelizmente, a empresa que fornece o MPLS não suportará a conexão, a menos que este protocolo esteja ativado. Eles dizem que a culpa é da nossa rede e chegamos a um impasse.

Alguém pode sugerir alguma ferramenta ou serviço para tentar identificar o problema?

    
por Murali Suriar 12.06.2009 / 11:40

8 respostas

1

Como você identificou que o STP no roteador é o culpado? Se você pegar a saída de um "show STP" em cada um dos seus roteadores / switches, você poderá ver onde está a raiz da árvore de abrangência.

A execução de um rastreamento de pacotes com o Wireshark ou algo semelhante mostraria a tempestade de transmissão em andamento, se é isso que está acontecendo, e esperamos que você o aponte na direção da caixa responsável.

    
por 12.06.2009 / 12:36
1

O restante da sua rede está executando o STP? Talvez este seja um problema com a eleição raiz.

BTW - Eu não vi muitas respostas no serverfault de especialistas da Cisco, talvez você devesse tentar #ciscohelp na EFNet (IRC).

    
por 12.06.2009 / 12:21
1

Algumas sugestões de solução de problemas. Você deve aplicá-las universalmente a todas as pontes de rede dentro do mesmo domínio Ethernet L2, o que provavelmente incluirá roteadores e switches. Você pode achar útil esboçar um diagrama rápido de todos os dispositivos envolvidos.

  1. Tem certeza de que a perda de conectividade é devida a um loop e não, inversamente, que o STP está tentando impedir um loop? Você pode confirmar isso verificando se o estado da porta STP está "bloqueando" antes e depois da interrupção.

  2. Você está usando o mesmo tipo de STP e fornecedor de hardware em ambos os sites? Existem várias variedades - STP, RSTP, PVST, RPVST e MSTP. Nem todos são compatíveis, especialmente quando se misturam fornecedores.

  3. Você já configurou algum dos dispositivos STP além de suas configurações padrão? Tal como para eleger uma ponte raiz, alterar horários ou criar grupos STP.

  4. Você pode não considerar este último item como o conselho mais útil imediatamente, mas eu aconselho ler um manual básico sobre o STP. Em redes pequenas, muitas vezes, "simplesmente funciona". Assim que você começa a crescer, é muito importante ter uma boa idéia de como ele funciona e como você deve influenciá-lo melhor. Em breve se tornará simples e menos magia negra.

por 12.06.2009 / 12:47
0

Quantos switches / hubs estão presentes em cada site? Existem outros links entre as redes de comutação em cada site?

Qual processo você seguiu para identificar que a Árvore Spanning foi a causa do problema? Você viu os logs da árvore de abrangência no dispositivo Cisco? Se assim for, por favor poste-os, poderemos sugerir uma interpretação alternativa deles (muitos logs da Cisco podem ser bem crípticos). A Spanning Tree está lá para garantir que não haja loops em sua rede. Não pode introduzir loops; no entanto, pode deixar de vê-los se estiver mal configurado.

Comece desenhando sua topologia de rede. Certifique-se de saber onde a raiz da sua árvore de abrangência deve ser. Identifique quaisquer loops na rede; Se a sua rede tiver algum loop, desabilitar a árvore de abrangência não é uma opção.

    
por 12.06.2009 / 13:20
0

Você poderia fornecer mais detalhes?

  1. Sua conexão em kilostream foi roteada anteriormente? Ou você tem uma rede de camada 2 plana abrangendo seus sites?
  2. Seu novo provedor está fornecendo MPLS de camada 2 ou MPLS de camada 3?
  3. Você poderia criar um link para um diagrama de topologia, pré e pós-alteração?

Em relação à desabilitação da árvore de abrangência; se você tiver spanning tree desativado, é possível que os loops da camada 2 se formem na sua rede. Isso causará problemas com (por exemplo) tráfego de broadcast, já que a Ethernet não possui nenhum conceito de 'Time to live'; quadros de transmissão irão circular pela rede para sempre, consumindo lentamente recursos. Como mencionado por Dan C, vale a pena ler uma cartilha sobre STP. Esta questão fornece um pequeno resumo e links para uma artigo que discute a questão de fazer um loop de ponte com mais detalhes.

    
por 12.06.2009 / 13:03
0

Você quase sempre quer usar o Rapid Per-VLAN STP, em vez de usar o STP simples. Eu digo quase só porque você não pode provar um negativo.

O Cisco Docs está disponível.

STP tem que eleger a bridge raiz para os segmentos L2, e essa eleição pode levar mais de um minuto ou mais. Se você não tiver configurado manualmente quem deve ser a bridge raiz, é possível que você tenha uma peça de equipamento abaixo do ideal fazendo a ponte (ou seja, você conecta a chave de 10 anos a uma 6500 e a mais velha tem uma boa probabilidade de vencendo a eleição por causa das regras de STP).

O RSTP diminui drasticamente os temporizadores no STP, por isso você deve convergir muito mais rápido.

O PVST tem eleições separadas para cada segmento, então se o seu link MPLS é o seu próprio segmento (e se não estiver, você está fazendo algo extremamente interessante ou extremamente ruim), então essa eleição deve afetar apenas esse link.

O Rapid-PVST combina as vantagens do RSTP e do PVST.

    
por 12.06.2009 / 13:36
0

Acho que precisaremos de mais informações para fornecer uma resposta útil. Por exemplo, você diz que "identificou o Spanning Tree Protocol do roteador cisco como a causa", mas normalmente os roteadores não participam da spanning tree, apenas os switches fazem isso. Quando você disse roteador, você realmente quis dizer um switch L3 (como um 3750)?

Em geral, o Spanning Tree apresenta um desempenho ruim em redes de alta latência, redes altamente congestionadas ou redes com problemas de confiabilidade / perda bem menores.

É difícil acreditar que você esteja realmente fazendo um loop, já que da sua descrição você só tem uma conexão entre dois escritórios. É mais provável que você tenha uma configuração incorreta, ou você tenha problemas com o circuito MPLS que está causando a queda de BPDU, colocando assim a spanning tree em estado de confusão.

Acho que para solucionar isso, você precisa descobrir quais dos seus switches são a raiz raiz da árvore de abrangência e documentar sua topologia de árvore de abrangência. Meu palpite é que, quando você fizer isso, você encontrará um problema claro, como dois switches que estão tentando ser a bridge raiz, uma spanning tree depth maior que 7, etc.

Você pode postar um diagrama da sua rede?

    
por 12.06.2009 / 18:30
0

Acho que entendo o que você está dizendo. Nas portas do switch que se conectam ao seu provedor MPLS, você deve poder bloquear mensagens STP (chamadas de filtragem BPDU).

No HP Procurves, o comando para ativar o filtro BPDU é:

spanning-tree <port-list> bpdu-filter

No switch Cisco, o comando deve ser algo semelhante a:

set spantree portfast bpdu-filter 6/1 enable
    
por 12.06.2009 / 18:41