Minha recomendação: adicione tempo de resposta aos seus registros.
Não é perfeito, pois não há garantia de que as solicitações que causam o pico demorem mais tempo para serem veiculadas do que outras, mas é provável, e fornece um ponto de partida para a investigação.
Para fazer isso, você desejará definir um novo LogFormat e CustomLog que inclua o parâmetro% D. Veja a documentação do Apache mod_log_config .
Outra opção, provavelmente um pouco baixa, mas que pode dar uma idéia da natureza da carga, seria usar strf no processo pai do apache com -f para seguir os filhos, e -c mostrar o tempo do cpu por chamada, por exemplo strace -f -c -p <apache parent pid>
Depois de conhecer as chamadas do sistema que levam mais tempo, você poderá rastreá-las diretamente. Por exemplo, digamos que o servidor esteja gastando muito tempo fazendo write (), você poderia fazer strace -f -e trace=write -p <apache parent pid>
e examinar essas chamadas com mais detalhes.