Nunca vi recomendações de dimensionamento da Microsoft para ARR.
Dito isto, se você não estiver usando o cache na camada ARR, as especificações serão mínimas. Sem o cache, o serviço ARR não está fazendo muito. Um único servidor low-end provavelmente manipulará sua carga de usuário. Certifique-se de que, seja qual for a NIC existente no servidor, sabe-se que funciona bem com o Receive Side Scaling. Além disso, se eu tivesse uma escolha entre dois pequenos servidores executando NLB e ARR versus um servidor maior, eu iria para os dois servidores menores para redundância.
Se você estiver usando o cache, eu recomendaria um único processador com muitos núcleos e muita RAM rápida. Se você tiver vários processadores, terá que lidar com a afinidade NUMA, o que não acredito que seja o mecanismo de cache da ARR.