É uma boa ideia banir o amazonaws.com [fechado]

3

O site é rastreado por um bot anônimo hospedado no amazon ec2. Este robô não respeita robots.txt e cria alta carga no servidor web, então eu adicionei checar se o IP reverso para solicitação termina com "amazonaws.com" e o servidor retorna 403 páginas imediatamente.

Este problema resolvido, mas pode causar outros problemas? ec2 pode ser usado para alguns "bons" bots e isso causará problemas de acesso para eles. Você pode dar exemplos de tais problemas?

    
por valodzka 15.09.2011 / 21:18

2 respostas

5

O Amazon EC2 é uma plataforma de hospedagem. Eles não controlam diretamente o que as pessoas hospedam. Se você bloquear todo o domínio * .amazonaws.com, interromperá o acesso a qualquer serviço hospedado usando o EC2. O que é bastante hoje em dia.

    
por 15.09.2011 / 21:26
1

Confira esta pergunta semelhante: mostra como bloquear o agente do usuário diretamente no arquivo .htaccess. Isso é bom para robôs que não seguem a regra do robots.txt ...

Bloqueio pelo user-agent string no httpd.conf não é efetivo

E você colocaria isso no arquivo httpd.conf, ou em um .htaccess.

Boa sorte.

    
por 15.09.2011 / 21:26