Logs do Apache inundados com conexões - “(via ggpht.com GoogleImageProxy)”

7

Meu servidor estava rodando em 100% da CPU e olhando para os logs do Apache, vi centenas de milhares de conexões que se pareciam com isso:

10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)"

O IP é o do meu balanceador de carga, que infelizmente eu não tinha configurado com o log, então não consigo identificar a verdadeira origem dessas solicitações.

Alguém sabe que tipo de tráfego é esse?

    
por user967722 13.03.2014 / 16:45

1 resposta

13

Também vejo tráfego como este.

  • Os endereços IP estão sempre no intervalo 66.249.64.0/19 , que é de propriedade do Google.
  • Os User-Agents que vejo são sempre os mesmos que você tem lá.
  • Os URLs solicitados são principalmente imagens, mas às vezes não.
  • A maioria dos URLs de imagem é solicitada várias vezes. As duas principais imagens mais solicitadas (que, aliás, incluímos apenas nos e-mails enviados pela plataforma) foram 2/3 do total de solicitações.

Tenho certeza de que está relacionado à alteração recente que eles fizeram no Gmail para automaticamente carregar imagens em e-mails , mas fazê-lo por meio de um proxy para que o destinatário não possa ser identificado.

Esta postagem do blog me ajuda e inclui o mesmo User-Agent.

Provavelmente, você poderia testar isso enviando a si mesmo um e-mail em HTML para seu endereço do Gmail, que incluía uma tag como essa (substituindo seu domínio por example.com , é claro):

<img src="http://example.com/this_probably_doesnt_exist.jpg">

Se você vir o mesmo tipo de acerto deste User-Agent para esse URL, então estou certo em meu palpite.

    
por 13.03.2014 / 18:44