Não é uma referência de brinquedo (não sei por que alguém faria isso), mas uma boa referência simples que você pode usar é unixbench . Um uso muito simples dele pode ser encontrado em serverbear . Você também pode configurar o unixbench para executar apenas certas partes (como ignorar o teste IO).
Além disso, não acho que seu código de amostra seja suficiente. Seria um single threaded, então, algo como um único núcleo Pentium 4 com clock de 4Ghz pode até mesmo vencer a ponte ivy four-way sex-core (24 core) com clock de 2,2Ghz.