Depende. Você presume que todas as consultas serão paralelizadas em todas as instâncias e, portanto, embora uma instância seja um (lote) mais lenta, você ainda obtém um grande aumento de velocidade. Isso não é verdade, o link depende do tipo de consulta que você executa.
Além disso, você precisaria encontrar uma chave de fragmentação muito boa - seus fragmentos são carentes de memória RAM e, portanto, é necessário ter um excelente cuidado para garantir que não haja muitos dados sobre cada um deles.
Por fim, e em geral, considere este post de um engenheiro 10gen link Etapa 1: não use sharding - O sharding do MongoDB é um assunto complicado e você tem muitas surpresas.