Você pode tentar usar o lsof para ler os arquivos abertos pelo processo do apache:
lsof -p PID
Verificar os logs do apache em busca de erros que correspondam aos timestamps do spider crawl em seus logs de acesso também é uma boa idéia.
Também gosto de usar o goaccess para ajudar a analisar os dados de log e extrapolar informações úteis:
strace e ltrace também são excelentes utilitários que você pode considerar usar para ajudar na solução de problemas.