Quando você realmente começa a se aprofundar em logs, você verá que um grande número de robôs faz spoofing de cabeçalho; a maioria deles falsificando como o IE (alguns deles sem sucesso; os erros de digitação fazem com que o seu agente seja visto rapidamente!).
Há um interessante experimento do EFF que procura identificar usuários com os dados apresentados pelo navegador: Panopticlick . Coletar mais informações no nível do aplicativo para tentar bloquear poderia levá-lo a algum lugar, pois os nós que não são do navegador não retornarão alguns desses campos.
Mas, no mesmo sentido em que é improvável que o bloqueio de seus IPs funcione por muito tempo, é improvável que a tentativa de bloquear com base no user-agent (ou em qualquer outro critério exclusivo) funcione por muito tempo se você estiver determinado a enganá-lo. No final, não valerá o seu tempo ou energia para tentar bloquear todos os bots desonestos da rede; basta configurar o seu arquivo robots.txt, fique de olho nos mais desagradáveis que tentarem te acertar com injeção de SQL ou algo parecido, e fique tranquilo.