Eu não escrevi essas regras, mas pelo que entendi, há uma strong correlação entre os clientes que não incluem esse cabeçalho e os clientes mal-intencionados e também entre os clientes que o incluem e os clientes benignos.
Você pode encontrar alguns bots (por exemplo: Pingdom, HostTracker, UpDowner, magpie-crawler, Yandex, Yodao, MJ12, GigaBot e o LinkedInBot em um grep rápido através de meus logs) que não enviam esse cabeçalho, no entanto, se você combine isso com uma regra que corresponda a agentes de usuário "normais", como Chrome, Firefox, IE, Safari, Opera, etc., e você poderá evitar o bloqueio desses bots.
Existem alguns clientes (ou possivelmente um proxy que modifica os cabeçalhos) que enviam um cabeçalho accept:
(e a maioria dos outros cabeçalhos em letras minúsculas). Ainda não consegui determinar se são maliciosos ou não, no entanto, todos eles afirmam ser "Firefox / 3.6.8" e possuem:
Via:HTTP/1.1 silk
X-Forwarded-For:10.161.106.98
ou algum outro endereço IP 10.x.x.x em seus cabeçalhos ... o que é suspeito.