O tráfego via rota estática no roteador não encontra o caminho de volta

3

esse me incomoda por alguns dias e não consigo encontrar uma solução. Desculpe pelo estranho título. Este não é meu principal campo de trabalho e atualmente não consigo pensar em um título melhor.

Alguns fatos:

  • Sou usuário em um ambiente de openstack compartilhado
  • Não consigo ver ou alterar a configuração da instalação de paralelismo aberto
  • As VMs são configuradas via cloud-init, que instala o python-minimal, cria um usuário e faz um apt-get dist-upgrade . Além disso, eles são configurados via DHCP com um IP estático.
  • Eu configurei nenhuma regra iptables nos nós.

Então, deixe-me descrever a configuração:

Eu criei uma rede + sub-rede (10.0.30.10/24). A rede está conectada a um roteador que contém duas rotas estáticas. Eu também criei duas VMs (ambas do Ubuntu 16.04.2 LTS) que receberam seu IP "principal" (node0: 10.0.30.10/24 e node1: 10.0.30.11/24) e também um segundo IP em uma sub-rede diferente (node0: 10.10 .10.2 / 24 e node1: 10.10.20.2/24).

Eu também configurei duas rotas estáticas no roteador que encaminham tudo para 10.10.10.0/24 para node0 e tudo para 10.10.20.0/24 para node1.

+----------------------------------------+
|  test-router                           |
|  IP: 10.0.30.1/24                      |
|                                        |
|  Static routes:                        |
|  - destination_cidr = "10.10.10.0/24"  |
|    next_hop         = "10.0.30.10"     |
|  - destination_cidr = "10.10.20.0/24"  |
|    next_hop         = "10.0.30.11"     |
+----------------------------------------+
        |
        |
  +------------------------+
  |  test-network          |
  |  Subnet: 10.0.30.0/24  |
  |  Router: 10.0.30.1     |
  +------------------------+
        |
        |
        |       +---------------------+
        |       |  node0              |
        +-------+  IP: 10.0.30.10/24  |
        |       |      10.10.10.2/24  |
        |       +---------------------+
        |
        |       +---------------------+
        |       |  node1              |
        +-------+  IP: 10.0.30.11/24  |
                |      10.10.20.2/24  |
                +---------------------+

Depois que as duas VMs são inicializadas, posso observar o seguinte:

Node0

$ route
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
default         10.0.30.1       0.0.0.0         UG    0      0        0 ens3
10.0.30.0       *               255.255.255.0   U     0      0        0 ens3
169.254.169.254 10.0.30.100     255.255.255.255 UGH   0      0        0 ens3
$ ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens3: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1400 qdisc pfifo_fast state UP group default qlen 1000
    link/ether fa:16:3e:31:67:52 brd ff:ff:ff:ff:ff:ff
    inet 10.0.30.10/24 brd 10.0.30.255 scope global ens3
       valid_lft forever preferred_lft forever
    inet 10.10.10.2/24 scope global ens3
       valid_lft forever preferred_lft forever
    inet6 fe80::f816:3eff:fe31:6752/64 scope link
       valid_lft forever preferred_lft forever
$ ping -c10 10.10.20.2
PING 10.10.20.2 (10.10.20.2) 56(84) bytes of data.
From 10.0.30.1: icmp_seq=2 Redirect Host(New nexthop: 10.0.30.11)
From 10.0.30.1: icmp_seq=3 Redirect Host(New nexthop: 10.0.30.11)

--- 10.10.20.2 ping statistics ---
10 packets transmitted, 0 received, 100% packet loss, time 8999ms

$ route
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
default         10.0.30.1       0.0.0.0         UG    0      0        0 ens3
10.0.30.0       *               255.255.255.0   U     0      0        0 ens3
10.10.10.0      *               255.255.255.0   U     0      0        0 ens3
169.254.169.254 10.0.30.100     255.255.255.255 UGH   0      0        0 ens3

Enquanto isso, no node1

# tcpdump icmp
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on ens3, link-type EN10MB (Ethernet), capture size 262144 bytes
09:25:55.451876 IP 10.0.30.10 > 10.10.20.2: ICMP echo request, id 1271, seq 1, length 64
09:25:55.451928 IP 10.10.20.2 > 10.0.30.10: ICMP echo reply, id 1271, seq 1, length 64
09:25:56.451467 IP 10.0.30.10 > 10.10.20.2: ICMP echo request, id 1271, seq 2, length 64
09:25:56.451503 IP 10.10.20.2 > 10.0.30.10: ICMP echo reply, id 1271, seq 2, length 64
09:25:57.451185 IP 10.0.30.10 > 10.10.20.2: ICMP echo request, id 1271, seq 3, length 64
09:25:57.451218 IP 10.10.20.2 > 10.0.30.10: ICMP echo reply, id 1271, seq 3, length 64
[..]
09:26:03.450910 IP 10.0.30.10 > 10.10.20.2: ICMP echo request, id 1271, seq 9, length 64
09:26:03.450943 IP 10.10.20.2 > 10.0.30.10: ICMP echo reply, id 1271, seq 9, length 64
09:26:04.450988 IP 10.0.30.10 > 10.10.20.2: ICMP echo request, id 1271, seq 10, length 64
09:26:04.451022 IP 10.10.20.2 > 10.0.30.10: ICMP echo reply, id 1271, seq 10, length 64

Então, minha conclusão é: node1 recebe o tráfego, mas a resposta não chega ao node0.

O mesmo acontece se eu iniciar um servidor da Web no node1 e tentar encurvá-lo por meio do IP roteado estaticamente. Eu vejo o tráfego chegando no node1, mas a resposta nunca chega ao node0.

Por outro lado: arping de node0 para node1 funciona:

# arping -c3 -i ens3 10.10.20.2
ARPING 10.10.20.2
42 bytes from fa:16:3e:a9:b4:bc (10.10.20.2): index=0 time=7.933 msec
42 bytes from fa:16:3e:a9:b4:bc (10.10.20.2): index=1 time=2.797 msec
42 bytes from fa:16:3e:a9:b4:bc (10.10.20.2): index=2 time=9.703 msec

--- 10.10.20.2 statistics ---
3 packets transmitted, 3 packets received,   0% unanswered (0 extra)
rtt min/avg/max/std-dev = 2.797/6.811/9.703/2.929 ms

Se eu usar o IP "principal", tudo funciona bem.

Coisas que tentei (em ambos os nós):

  • Definindo /proc/sys/net/ipv4/conf/ens3/rp_filter para 2 e 0 (porque estou desesperado). Nada mudou.
  • Definindo /proc/sys/net/ipv4/ip_forward para 1 . Nada mudou.
  • Definindo /proc/sys/net/ipv4/conf/ens3/log_martians para 1 em ambos os nós. Nenhuma saída via journalctl -f .

EDIT: Há saída no node0 se eu pingar node1 através do IP estático:

May 03 11:16:01 node0 kernel: IPv4: Redirect from 10.0.30.1 on ens3 about 10.0.30.11 ignored
                                Advised path = 10.0.30.10 -> 10.10.20.2

E como estou ficando sem ideias, preciso da sua ajuda. Obrigado por dedicar seu tempo ao meu problema!

    
por malte 03.05.2017 / 12:01

0 respostas