Existe uma caixa do Linux.
Existe um dispositivo Netapp defeituoso que serve armazenamento.
Eles estão na mesma sub-rede, portanto, teoricamente, não é necessário roteamento.
O problema: Às vezes podemos alcançar o LIF do netapp, a partir da caixa do Linux, às vezes não podemos (de acordo com o tcpdump ele simplesmente não responde).
A pergunta: o que poderia causar tal problema?
UPDATE # 1 : criou estatísticas sobre quando é bom, ruim, com:
while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt
Então, a cada segundo, o netcat tenta se conectar a partir da caixa do Linux - > para o Netapp.
# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#
Ao tentar 1000 vezes, obtivemos um SSH 520 vezes, e 480 vezes o tempo limite, então cerca de ~ 52% bom, ~ 48% ruim. Talvez 50-50%? Pode haver algum problema semelhante a um failover?
UPDATE # 2 : outra coisa interessante é que o Netapp ruim não pode ser pingado, enquanto todos os outros Netapp são pingáveis.
Tags networking