Latência de Rede Hospedada

2

Antecedentes

Eu tenho um novo servidor de banco de dados dedicado e hospedado por trás de um firewall dedicado (Cisco ASA 5505 Sec +). O plano é ter um servidor da Web virtual (também conhecido como "nuvem") ou dois do outro lado do firewall, conectando-se de volta ao servidor de back-end do DB.

Durante a configuração do servidor, não fiquei impressionado com o desempenho da rede. Acontece que, embora os 2 servidores tenham GigE - o firewall suporta apenas 100Mb - então a maioria dos problemas de desempenho que eu tive podem ser adequadamente explicados por isso.

Problema

No entanto, como parte da solução de problemas, executei uma série de pings no firewall do servidor dedicado. Esses pings voltaram com alguns resultados interessantes - especificamente, a distribuição de 100 pings foi:

57% < 1ms
14% between 1ms and 2ms
12% between 2ms and 3ms
11% between 3ms and 6ms
6% >= 6ms
Min/Avg/Max: 0/1/8 ms

Eu esperava que o primeiro salto fosse < 1ms de forma consistente (e não posso lembrar honestamente qualquer ambiente com fio rígido onde não foi). Testes subsequentes foram bem parecidos, e tem sido por muitos dias - então isso não parece ser um incidente isolado. Nenhum retransmite ou pacotes descartados foram observados. O ping no firewall mostra um desempenho semelhante:

58% < 1ms
14% between 1ms and 2ms
8% between 2ms and 2ms
14% between 3ms and 6ms
6% >= 6ms
Min/Avg/Max: 0/2/56 ms

Resolução de problemas

O anfitrião checou o servidor, o firewall e o (s) comutador (es) interveniente (s) e não vê problemas. Eles também apontam que "despriorizam" o tráfego ICMP na rede. Eles notaram algumas recentes oscilações de porta (provavelmente causadas, na minha opinião, pela configuração do servidor) e "continuarão monitorando" a situação. O flapping de porta não é numeroso o suficiente ou correlacionado o tempo suficiente para explicar os tempos de ping, embora possa ser possível que seja um sintoma (nother) de um problema subjacente.

Eu não tenho acesso direto ao ASA - mas o hoster correu algumas estatísticas sobre isso como parte da solução de problemas:

# ping ***** (series of 5-packet pings from firewall to server, edited for brevity)
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/2/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/4/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/2/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/8/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/6/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms

# show cpu usage
CPU utilization for 5 seconds = 13%; 1 minute: 11%; 5 minutes: 10%

# show mem
Free memory:       341383104 bytes (64%)
Used memory:       195487808 bytes (36%)
-------------     ----------------
Total memory:      536870912 bytes (100%)

# show int eth0/1
Interface Ethernet0/1 "", is up, line protocol is up
Hardware is 88E6095, BW 100 Mbps, DLY 100 usec
    Full-Duplex(Full-duplex), 100 Mbps(100 Mbps)
    Available but not configured via nameif
    MAC address *****, MTU not set
    IP address unassigned
    5068644 packets input, 5077178693 bytes, 0 no buffer
    Received 4390 broadcasts, 0 runts, 0 giants
    0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored, 0 abort
    0 L2 decode drops
    387883 switch ingress policy drops
    3220647 packets output, 1648213382 bytes, 0 underruns
    0 output errors, 0 collisions, 0 interface resets
    0 babbles, 0 late collisions, 0 deferred
    0 lost carrier, 0 no carrier
    0 input reset drops, 0 output reset drops
    0 rate limit drops
    0 switch egress policy drops

Exceto por algum uso aparentemente alto da CPU para um firewall com poucas ACLs e possivelmente apenas uma sessão RDP passando por ele, não vejo nada alarmante sobre as estatísticas do ASA. Certamente não parece IMHO sobrecarregado.

Pergunta

Considerando que estamos nos aproximando dos tempos de busca de disco, e ainda não há tráfego de produção no firewall ou no servidor - ainda estou um pouco preocupado. O que é que vocês acham? Isso é um problema? Isso é normal em um ambiente de data center maior?

    
por Mark Brackett 03.09.2013 / 15:22

1 resposta

2

Primeiro, você não está dizendo qual modelo específico de ASA você possui, nem o modo de licenciamento. Por favor poste a saída de "sh ver" e "sh int Ethernet0 / 0".

Dito isto - diferentes modelos ASA têm diferentes limites de rendimento. Como exemplo, o ASA5510 tem um limite máximo de throughput (simultâneo) de 300mbps. Consulte o link para obter a lista completa.

Quando se trata de latência - todos os produtos da Cisco colocam o tráfego diretamente no dispositivo na fila inferior. É por isso que é uma prática ruim para o eco do ICMP em relação a um roteador ou firewall, pois os resultados nunca são previsíveis. Nós temos dois ASA5510 aqui (ambos com gigabit), e dois switches 3750-X, e todos eles pulam até 300ms de latência de eco ICMP quando estão empurrando muito tráfego.

Isso não significa que o tráfego roteado / encaminhado seja lento

Se você quiser verificar a latência, use ping entre dispositivos no ASA. É a única maneira confiável.

    
por 03.09.2013 / 15:53