Dê uma olhada na cadeia do agente HTTP. (isso também deve estar no seu log de acesso) Isso pode ajudá-lo a descobrir / o que está vindo.
NÃO se parece com uma solicitação normal de webcrawler, parece uma tentativa de encontrar material para download.
Dê uma olhada na pesquisa inversa de DNS do host que está fazendo essa análise. Também pode ajudar.
E, por último, sempre que vir tráfego que não é o que você deseja / espera para seu próprio site, fique à vontade para bloqueá-lo. Se você não vir nenhuma solicitação legítima proveniente desse IP, isso sobrecarregará seus logs com lixo que você não deseja. Meu conselho, bloqueie-o.