1) Por que você precisa de 4 nós para o conjunto de réplicas? usando um número par de nós em um conjunto de réplicas pode ser muito problemático, uma vez que quando um failover acontece, há uma eleição entre os nós para decidir qual será o principal, leia este - > link
3 nós são mais do que suficientes, 2 nós de db reais e 1 arbitragem pequena que apenas ajuda na eleição
2) em relação ao cluster de fragmentos - > o número mínimo de servidores físicos para um cluster com 2 shards com o conjunto mínimo de réplicas por shard é 9 (!), a divisão é a seguinte: shard 1 (conjunto de réplicas): 2 nós de dados + 1 arbitar (pode ser micro instância) shard 2 (conjunto de réplicas): 2 nós de dados + 1 arbitar (pode ser micro instância) 3 servidores de configuração (MUST !!) - estes podem ser máquinas bastante pequenas - usamos a instância t1.micro na amazon AWS.
Cada shard que você deseja adicionar ao cluster irá custar mais 3 nós físicos conforme acima.
mongos - > estas são instâncias do cliente com as quais o driver mongo do applcation deve interagir. Você pode implantá-los como parte de qualquer servidor da Web, para que você não precise de uma máquina separada.
veja isto para mais informações - link