Meu site está sendo bloqueado repentinamente, e não um tráfego legítimo

2

Eu gerencio um site com cerca de 700 usuários registrados. Em um dia típico, há 30 a 50 ocorrências.

Nos últimos três dias, o tráfego aumentou incrivelmente rápido (de acordo com o Google Analytics). Eu tenho 7,287 acessos hoje. Meu número de novos usuários registrados não aumentou proporcionalmente.

ParecequeamaioriadelesédaRússia,oqueéengraçadoporqueestounosEUAemeusiteéapenaseminglês.

Agora, fiz algumas pesquisas no Google para conferir o que há com todos esses links de referência no Google Analytics.

Eu li que a maioria deles são apenas hits de spam de referência russa, nos quais alguém extraiu minha chave do Google Analytics do meu HTML, e eles acessaram o Google Analytics milhares de vezes para me irritarem sem realmente solicitar nada do meu servidor (o que é bom, mas eu acho que torna o Google Analytics pouco mais valioso, porque agora meus dados estão poluídos, mas isso está além do ponto ...).

No entanto, meus registros Nginx mostram um aumento significativo na quantidade de tráfego nos últimos dias. Os hits de spam de referência russos representam apenas metade do número total no Google Analytics. Eu sinceramente não consigo entender por que alguém acessa meu site várias vezes, é necessário interação humana para obter qualquer conteúdo significativo do meu site.

O que posso fazer para me proteger desse tráfego ilegítimo? A minha única opção é iniciar a lista negra de endereços IP?

    
por Matt Reyer 17.02.2015 / 06:38

2 respostas

2

Parece que você acabou de se tornar bastante popular. Alguém deve ter colocado um link para alguns dos seus artigos.

  1. esta é uma das maiores comunidades profissionais russas
  2. este é um dos maiores sites de entretenimento da Rússia
  3. este é o subsite móvel de p. 1.
  4. esta é a rede social russa mais popular
por 17.02.2015 / 07:12
1

Spoofing o cabeçalho "Referer" é realmente fácil, e eu vi muitas vezes scrapers e bots fazendo isso. Seria ótimo se você pudesse cheirar o tráfego TCP e nos mostrar como essas solicitações HTTP se parecem. O Tcpdump pode fazer o truque; Depende do seu ambiente, mas experimente:

$ tcpdump -i eth0 -A -vvv -s 500 'tcp port 80 and ip[2:2] > 40 and tcp[tcpflags] & tcp-push != 0 and dst port 80'

Isso fareja todas as solicitações HTTP direcionadas para o seu servidor da Web, então você pode ver os resultados procurando pelos referenciadores russos.

    
por 24.02.2015 / 10:36