Consegui obter a velocidade do relógio para aumentar o meu programa! Isso acontece de forma esporádica, porque a carga gráfica é muito baixa na maioria das vezes. Se eu colocar uma carga mais constante (algum sombreamento mais pesado), com certeza eu obterei dados de temporização mais consistentes quando a velocidade do clock for atrelada ao máximo.
Na verdade, isso é realmente muito interessante, porque significa que meu programa é tão bem otimizado que pode manter a GPU ociosa por tempo suficiente para que a aceleração ocorra. Quando eu elimino as chamadas de sono no meu programa (para que a simulação corra muito mais rápido que o tempo real), agora consigo manter o clock da GPU em 1200Mhz. Parece que a reinicialização (e a execução da versão de lançamento da compilação) o ajudou a se ajustar.
Atualização: Eu resolvi qual era o problema com o qual estava lidando, mas não cheguei a uma resposta satisfatória para a minha pergunta original, que é como verificar a velocidade real de um Intel Sandy Bridge IGP no OSX. Alguém pode me ajudar com isso? (Engenheiros da Apple talvez?)