O benchmarking localmente não pode dar a você nenhuma indicação de como seu site será executado em um host remoto, a menos que você consiga replicar o hardware, o software em execução etc. no host remoto.
A diferença nos resultados que você tem é normal, já que você está comparando dois sistemas totalmente diferentes. Eu recomendo que você considere os resultados do benchmark remoto, já que isso deve refletir (e dar uma idéia) de quantas conexões seu aplicativo pode suportar.
Além disso, o cerco é uma ferramenta incrível para isso. Ambos ab e siege podem ser facilmente roteirizados para automação & poste a comparação dos resultados de benchmarking, mas o cerco permite que páginas aleatórias sejam solicitadas em vez de uma URL específica, o que contribui para um benchmark mais realista.
Espero que isso ajude, boa sorte.