Você pode usar os contadores de desempenho perf para executar o perfil da execução do programa. Basicamente você faz
perf stat your_executable your_options
Aqui são alguns exemplos rápidos e aqui é um artigo mais detalhado.
Tenha em mente que em CPUs modernas, os ciclos de clock usados para executar algo variam de acordo com o uso do cache, agendamento / reordenamento interno etc. Então, se você quiser identificar gargalos de perfil, use as outras opções perf
.