A correspondência de sequências do agente do usuário não é um método confiável, já que qualquer um pode alterá-lo nos cabeçalhos.
Da minha experiência, todos os servidores de Internet enfrentados pela Internet são semelhantes a serem rastreados e navegados (esse é o ponto certo? :)).
Se qualquer coisa, eles estão apenas rastreando o seu servidor web para indexação de algum tipo. Se você quiser frustrar ou limitar a frequência dessas solicitações, sugiro que apache mod_evasive, ou mod_dosevasive ou mod_qos, limite o número de conexões simultâneas por IP por segundo e mais.
Lembre-se de que essa solução pode levar seu servidor da web a bloquear solicitações legítimas de solicitações roteadas de NAT, e assim por diante.
Em seguida, você precisará codificar o 403 para se proibir definindo um conjunto de regras de comportamento de rastreamento em seu aplicativo php quando os bots aprenderem sua configuração de frequência evasiva de mods do apache.