Acontece que é um problema de roteamento no switch. O roteamento multicast para a VLAN no 10.1.1.x não está ativado. Uma vez que adicionamos 'pim sparse-mode' no nosso roteador cisco. Tudo está funcionando como esperado.
Estou usando 'socat' no Linux Centos 7 para diagnosticar alguns problemas. Servidor e clientes são todos linux centos7, todos eles possuem múltiplas interfaces. O servidor 10.1.1.1 está no switch 1, 10.1.1.2 está no switch 2. O switch 1 e o switch 2 são switches da Camada 3, conectados diretamente, executando o Cisco NX-OS. Esta é uma situação que não consigo explicar:
servidor 10.1.1.1 (conecte ao Switch 1, remetente do pacote UDP) para enviar dados via STDIN:
socat STDIO UDP4-DATAGRAM:239.2.2.1:12345
client 10.1.1.2 (conecte ao Switch 2, receptor de pacotes UDP):
socat UDP4-RECVFROM:12345,ip-add-membership=239.2.2.1:10.1.1.2,fork,reuseaddr -
O cliente recebe os pacotes UDP do servidor, até eu iniciar outro receptor na mesma máquina que o servidor 10.1.1.1:
socat UDP4-RECVFROM:12345,ip-add-membership=239.2.2.1:10.1.1.1,fork,reuseaddr -
No momento em que inicio este segundo receptor, o cliente no 10.1.1.2 deixa de receber quaisquer dados do servidor. Eu também uso o tcpdump e vejo que nenhum pacote foi recebido naquela porta no 10.1.1.2. Além disso, a partir de então, mesmo que eu reinicie o servidor e os clientes, o 10.1.1.2 não recebe mais pacotes multicast do 10.1.1.1 para o prefixo THAT multicast (239.2.2.x).
Isso é um problema no roteamento de switches? ou perdi alguns parâmetros na linha de comando 'socat'? Eu verifiquei que rp_filter = 0 nessa interface (10.1.1.x).
EDIT: Atualize a pergunta para incluir mais configurações de rede. como mais suspeita sobre isso como um problema de roteamento.
UPDATE: descobrimos que a VLAN 10.1.1.x no switch Layer3 não tem habilitação PIM. Isso provavelmente significa que o roteamento multicast não está habilitado. Dito isso, não sei por que a primeira vez que o 10.1.1.2 no switch diferente receberia dados em primeiro lugar.
Acontece que é um problema de roteamento no switch. O roteamento multicast para a VLAN no 10.1.1.x não está ativado. Uma vez que adicionamos 'pim sparse-mode' no nosso roteador cisco. Tudo está funcionando como esperado.