Na minha opinião, é uma falha hetzner. Eu tenho discutido com eles por um longo tempo sobre casos semelhantes.
Tivemos esses problemas e reportamos para a empresa de hospedagem. A resposta foi sempre a mesma - "Por favor, anexe mtr em ambas as direções" - eles responderiam assim mesmo durante a falha. Então nós escrevemos um daemon que irá iniciar o mtr toda vez que tivermos alguma perda de pacotes entre servidores:
if [ -z $1 ] ; then echo "Give target host" else host=$1 while true ; do loss='ping -c 10 $host | grep packet | awk {'print $6'} | sed s/%//g' if [ $loss -ge 1 ]; then echo 'date' >> /root/scripts/loss_measure_mtr.log mtr -s 1500 -r -c 1000 -i 0.1 $host >> /root/scripts/loss_measure_mtr.log fi done fi
Depois, com essas informações, eles responderam:
At this time there was an incoming attack in the subnet. In this case it is possible that packet-loss occurs at servers in the same subnet. Best Regards Michael Straetz Hetzner Online AG Support 90431 Nürnberg / Germany Tel: +49 (911) 234 226 54 Fax: +49 (911) 234 226 8 977 http://www.hetzner.de
O que exatamente está acontecendo? Eu não sei, mas parece quase o mesmo:
Sun Aug 12 01:13:20 CEST 2012 HOST: app Loss% Snt Last Avg Best Wrst StDev 1. 94.1% 1000 0.2 0.2 0.1 0.4 0.1 2. static.1.24.24.46.clients.you 0.0% 1000 3.0 1.9 0.7 19.4 1.5 3. hos-tr4.juniper2.rz13.hetzne 9.4% 1000 0.6 1.9 0.4 133.2 8.0 4. hos-bb2.juniper1.rz1.hetzner 5.4% 1000 38.6 7.1 3.0 112.9 11.5 5. hos-tr1.ex3k3.rz1.hetzner.de 10.9% 1000 4.4 5.1 3.6 23.6 1.8** 6. static.88-128-24-108.clients 15.5% 1000 3.6 3.5 3.4 4.6 0.1 HOST: app Loss% Snt Last Avg Best Wrst StDev 1. 94.5% 1000 0.2 0.2 0.1 0.6 0.1 2. static.1.24.24.46.clients.you 0.0% 1000 1.2 1.9 0.7 19.3 1.6 3. hos-tr4.juniper2.rz13.hetzne 9.3% 1000 0.6 1.8 0.4 136.8 7.9 4. hos-bb2.juniper1.rz1.hetzner 2.7% 1000 3.3 7.0 3.0 113.1 11.5 5. hos-tr1.ex3k3.rz1.hetzner.de 8.5% 1000 7.0 5.1 3.6 26.8 2.0 6. static.88-128-24-108.clients 12.8% 1000 3.6 3.5 3.3 4.5 0.1 I have tens of mtr's like this.
Na minha opinião, são os problemas de infraestrutura deles. Observe que a perda está ocorrendo nos nós: hos-tr1.ex3k3.rz1.hetzner.de , hos-tr4.juniper2.rz13.hetzner.de e assim por diante.
Se eles não corrigirem, provavelmente migrarei para linode ou amazon.