Antecedentes
Eu tenho um novo servidor de banco de dados dedicado e hospedado por trás de um firewall dedicado (Cisco ASA 5505 Sec +). O plano é ter um servidor da Web virtual (também conhecido como "nuvem") ou dois do outro lado do firewall, conectando-se de volta ao servidor de back-end do DB.
Durante a configuração do servidor, não fiquei impressionado com o desempenho da rede. Acontece que, embora os 2 servidores tenham GigE - o firewall suporta apenas 100Mb - então a maioria dos problemas de desempenho que eu tive podem ser adequadamente explicados por isso.
Problema
No entanto, como parte da solução de problemas, executei uma série de pings no firewall do servidor dedicado. Esses pings voltaram com alguns resultados interessantes - especificamente, a distribuição de 100 pings foi:
57% < 1ms
14% between 1ms and 2ms
12% between 2ms and 3ms
11% between 3ms and 6ms
6% >= 6ms
Min/Avg/Max: 0/1/8 ms
Eu esperava que o primeiro salto fosse < 1ms de forma consistente (e não posso lembrar honestamente qualquer ambiente com fio rígido onde não foi). Testes subsequentes foram bem parecidos, e tem sido por muitos dias - então isso não parece ser um incidente isolado. Nenhum retransmite ou pacotes descartados foram observados. O ping no firewall mostra um desempenho semelhante:
58% < 1ms
14% between 1ms and 2ms
8% between 2ms and 2ms
14% between 3ms and 6ms
6% >= 6ms
Min/Avg/Max: 0/2/56 ms
Resolução de problemas
O anfitrião checou o servidor, o firewall e o (s) comutador (es) interveniente (s) e não vê problemas. Eles também apontam que "despriorizam" o tráfego ICMP na rede. Eles notaram algumas recentes oscilações de porta (provavelmente causadas, na minha opinião, pela configuração do servidor) e "continuarão monitorando" a situação. O flapping de porta não é numeroso o suficiente ou correlacionado o tempo suficiente para explicar os tempos de ping, embora possa ser possível que seja um sintoma (nother) de um problema subjacente.
Eu não tenho acesso direto ao ASA - mas o hoster correu algumas estatísticas sobre isso como parte da solução de problemas:
# ping ***** (series of 5-packet pings from firewall to server, edited for brevity)
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/2/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/4/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/2/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/8/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/6/10 ms
Success rate is 100 percent (5/5), round-trip min/avg/max = 1/1/1 ms
# show cpu usage
CPU utilization for 5 seconds = 13%; 1 minute: 11%; 5 minutes: 10%
# show mem
Free memory: 341383104 bytes (64%)
Used memory: 195487808 bytes (36%)
------------- ----------------
Total memory: 536870912 bytes (100%)
# show int eth0/1
Interface Ethernet0/1 "", is up, line protocol is up
Hardware is 88E6095, BW 100 Mbps, DLY 100 usec
Full-Duplex(Full-duplex), 100 Mbps(100 Mbps)
Available but not configured via nameif
MAC address *****, MTU not set
IP address unassigned
5068644 packets input, 5077178693 bytes, 0 no buffer
Received 4390 broadcasts, 0 runts, 0 giants
0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored, 0 abort
0 L2 decode drops
387883 switch ingress policy drops
3220647 packets output, 1648213382 bytes, 0 underruns
0 output errors, 0 collisions, 0 interface resets
0 babbles, 0 late collisions, 0 deferred
0 lost carrier, 0 no carrier
0 input reset drops, 0 output reset drops
0 rate limit drops
0 switch egress policy drops
Exceto por algum uso aparentemente alto da CPU para um firewall com poucas ACLs e possivelmente apenas uma sessão RDP passando por ele, não vejo nada alarmante sobre as estatísticas do ASA. Certamente não parece IMHO sobrecarregado.
Pergunta
Considerando que estamos nos aproximando dos tempos de busca de disco, e ainda não há tráfego de produção no firewall ou no servidor - ainda estou um pouco preocupado. O que é que vocês acham? Isso é um problema? Isso é normal em um ambiente de data center maior?