OK, aqui está minha situação.
Isso está na internet. O 6224 é o roteador nesta foto e reside fisicamente em Kanata.
Tanto a VLAN 1697 quanto a 3994 são fornecidas por um provedor de serviços de Internet. Essas VLANs são fornecidas por meio de um único fio Ethernet de 1 Gb.
Os hospedeiros Kanata estão diretamente ligados ao 6224; os outros dois sites são remotos.
A VLAN 3994 é um espaço de endereço IP único, portanto, teoricamente, não deve importar fisicamente onde os hosts dessa sub-rede estão.
Aqui está o problema.
Eu tenho um sistema de monitoramento que está conectado ainda mais na internet, então as sondas do monitor chegariam a este diagrama na VLAN do 1697.
Quando eu sondar hosts em Albert ou Bells Corners da Internet, há 0 perda. A conexão parece perfeita.
Quando faço ping em hosts no Kanata, perco de 10 a 40% dos pings. A perda não é previsível, mas: quando eu perdê-los, eu sempre perco pelo menos 3, geralmente 4, raramente mais, pings em um monte.
Anexei um monitor diretamente ao 6224 em Kanata em 3994 ..
Quando o monitor pinga a interface de roteamento 6224, vejo exatamente o mesmo padrão de perda - mas NÃO ao mesmo tempo que a perda do sistema remoto. O tempo de ping é de cerca de 1 ms.
Quando o monitor pinga outro sistema conectado diretamente ao 6224, há 0 perda. O tempo de ping é de aproximadamente 0,1 ms, um décimo do tempo para fazer o ping do roteador.
Alguém sabe o que está acontecendo aqui?
Atualize para deixar as coisas menos claras, talvez
O que parece estar acontecendo é que o tráfego que entra e sai da conexão do ISP é bom. O tráfego que vai do cérebro do roteador para o cérebro de comutação (ou de volta, talvez) é o que está tendo o problema.
Não posso culpar o ISP porque o acesso à Internet de / para os dois sites remotos é sólido. São apenas hosts diretamente conectados ao 6224 que estão tendo problemas.
Atualização 2
OK, depois de muito tempo olhando para os traços, tenho um sintoma mais específico.
Eu fiz um tcpdump na vlan 3994 do uplink do ISP procurando pelo meu endereço na teoria de que tudo que eu deveria ver seria o tráfego de broadcast indo para os sites remotos. Em vez disso, vi os pacotes que eu esperava ver na interface do meu sistema descendo o TLS nessa VLAN.
Então:
Por alguma razão, o 6224 frequentemente pensa que o meu sistema está no final do TLS.
Quando eu inspeciono a tabela de comutação quando as coisas estão funcionando, minha entrada é assim:
3994 0007.E924.F714 2/g16 Dynamic
... o que faz sentido, já que está conectado à porta 16. No entanto, quando está quebrado, é assim:
3994 0007.E924.F714 2/g22 Dynamic
Fluxos de pacotes mal direcionados parecem ser liderados por uma transmissão do meu sistema. No entanto, vejo uma transmissão deixar meu sistema e duas na 3994 VLAN para o TLS. Geralmente é um IGMP V2 Membership Report / Junta-se ao Grupo 224.0.0.251, mas às vezes é o chip de gerenciamento em meu sistema arping para si mesmo (ele faz isso a cada 2 segundos ou mais por razões que são estúpidas).
Isso implica que existe um sistema em Bells Corners ou Albert que está ouvindo minha transmissão e repetindo por algum motivo. Então o 6224 vai ah, esse mac deve estar realmente no link TLS e ajusta sua tabela de comutação de acordo.
Esta descrição do problema toca algum sino?