O uso da CPU da página de status do servidor do Apache é o uso médio desde que o Apache foi iniciado, de modo que não mostrará picos como este. Quando você obtiver esses picos de carga, poderá verificar a página de status do servidor para ver quais páginas / clientes estão sendo servidores (ExtendedStatus deve estar ativado).
Você também pode usar o netstat para ver quais clientes estão acessando atualmente sua máquina:
netstat -an | grep ESTABLISHED
Se você executar isso durante várias horas e picos de tráfego, talvez consiga localizar um endereço IP recorrente e rastreá-lo para um robô / rastreador específico. Se isso acontecer, consulte o robots.txt para limitar a velocidade com que robôs que se comportam devem rastrear seu site.
Editar: Em um servidor ocupado, o comando netstat acima deve mostrar algumas entradas como:
tcp 0 0 10.2.212.13:80 216.146.52.21:24979 ESTABLISHED
tcp 0 0 10.2.212.13:80 86.174.113.138:54901 ESTABLISHED
tcp 0 0 10.2.212.13:80 94.1.216.253:51204 ESTABLISHED
tcp 0 0 10.2.212.13:80 24.9.61.204:62936 ESTABLISHED
O endereço IP do cliente será o da direita. Se você vê apenas 1 ou 2 linhas, isso significa que, naquele momento, existe apenas a conexão ssh. Verifique novamente quando sua carga aumenta. Você também pode remover o grep para listar todas as conexões, embora isso inclua um grande número de TIME_WAIT antigos.
Gostaria de começar com o status estendido do servidor e ver se isso pode revelar rastreadores óbvios durante picos de tráfego.