Ajuda! Por que bots bloqueados ainda desperdiçam largura de banda?

1

Eu bloqueei a maioria dos bots que continuam enviando solicitações POST para o meu site, usando o .htaccess.

Cada vez que um desses bots tenta acessar meu site, ele recebe uma mensagem de erro 403 proibida.

Minha pergunta é: por que meu uso de largura de banda continua aumentando se eu os bloqueei no arquivo .htaccess?

Sempre tive a impressão de que a largura de banda da hospedagem é medida pela quantidade de dados que o meu servidor envia, não pela quantidade que recebe.

Existe uma maneira de configurar meu arquivo .htaccess para simplesmente ignorar esses bots e não enviar de volta um código de status?

A propósito, estou usando um servidor compartilhado com largura de banda "ilimitada", mas a quantidade de largura de banda que esses bots estão desperdiçando é ridícula.

Obrigado!

    
por Zero 31.10.2010 / 07:36

4 respostas

6

Os arquivos .htaccess informam ao servidor qual resposta específica deve ser enviada para esses bots. Portanto, a solicitação ainda está acontecendo e você ainda está enviando dados de volta (a mensagem 403).

Você não tem como evitar que a solicitação da botnet chegue até você, somente o seu provedor pode bloqueá-la antes que ela chegue ao seu servidor. No entanto, você não pode enviar nada de volta simplesmente fechando a conexão para este IP. Não tenho certeza se o Apache tem um módulo para fazer isso, caso contrário, você pode usar um firewall de software como o iptables para fazer isso.

    
por 31.10.2010 / 08:45
5

No momento em que o arquivo .htaccess entrar em vigor, a carga útil do cliente já passou pela interface de rede do seu servidor. Do ponto de vista do seu ISP, basicamente não há diferença no tráfego de entrada ou de saída do seu servidor. Você ou seu provedor terá que pagá-lo de qualquer maneira.

Se você não quiser que qualquer transferência de dados aconteça, você precisará bloquear os clientes no roteador de borda do seu ISP (ou pelo menos em um filtro de pacotes que não está sendo executado no servidor em si).

    
por 31.10.2010 / 08:13
2

De acordo com as outras respostas, uma vez que o bot chega ao estágio de receber uma resposta 403, você tem dados enviados e recebidos.

Provavelmente seria melhor não responder, se você puder encontrar um módulo do Apache para simplesmente soltar a conexão.

Se você tem controle sobre o host E usa cookies SYN, pode valer a rota de todos os IPs que você bloqueia para 127.0.0.1 (ou, talvez até melhor, adicione-os a uma regra DROP em uma cadeia de iptables). / p>     

por 31.10.2010 / 10:31
1

Existem várias abordagens que você pode seguir. Uma delas é configurar regras de firewall via iptables. Em segundo lugar está desautorizando esses bots em robot.txt

    
por 31.10.2010 / 21:15