O número mínimo é 1 servidor. Se por "produção" você quer dizer "tolerante a falhas", então o número mínimo é 3: você tem um conjunto de réplicas contendo 3 servidores. Os servidores de configuração também são executados nesses servidores. Se você quiser incluir "escala horizontal", ou seja, "escala da Web!" além disso, o número mínimo é 9: você tem dois fragmentos que consistem em conjuntos de réplicas de três servidores e mais três servidores como servidores de configuração. Se você incluir seu aplicativo, não apenas o mongodb, adicione os dois servidores de aplicativos à mistura para um total de 11 (vai para 11!).
Basicamente você está interpretando a imagem incorretamente de duas maneiras: seus servidores de aplicativos não fazem parte de um cluster mongodb e os shards (caixas verdes) são conjuntos de réplicas, que contêm pelo menos 3 servidores.