O Amazon EC2 é uma plataforma de hospedagem. Eles não controlam diretamente o que as pessoas hospedam. Se você bloquear todo o domínio * .amazonaws.com, interromperá o acesso a qualquer serviço hospedado usando o EC2. O que é bastante hoje em dia.
O site é rastreado por um bot anônimo hospedado no amazon ec2. Este robô não respeita robots.txt e cria alta carga no servidor web, então eu adicionei checar se o IP reverso para solicitação termina com "amazonaws.com" e o servidor retorna 403 páginas imediatamente.
Este problema resolvido, mas pode causar outros problemas? ec2 pode ser usado para alguns "bons" bots e isso causará problemas de acesso para eles. Você pode dar exemplos de tais problemas?
O Amazon EC2 é uma plataforma de hospedagem. Eles não controlam diretamente o que as pessoas hospedam. Se você bloquear todo o domínio * .amazonaws.com, interromperá o acesso a qualquer serviço hospedado usando o EC2. O que é bastante hoje em dia.
Confira esta pergunta semelhante: mostra como bloquear o agente do usuário diretamente no arquivo .htaccess. Isso é bom para robôs que não seguem a regra do robots.txt ...
Bloqueio pelo user-agent string no httpd.conf não é efetivo
E você colocaria isso no arquivo httpd.conf, ou em um .htaccess.
Boa sorte.