Primeiro, não há nenhuma "média" em HPC que eu saiba - tive o prazer de trabalhar em três ambientes de HPC, e todos os três tiveram dinâmicas bastante diferentes (nos termos clássicos de modelagem de gargalo, um era limite de disco, um foi limitado pela CPU e um foi limitado pela memória).
Isso leva diretamente à minha resposta à sua pergunta: você precisa de "algum tipo de NAS paralelo" quando estiver com o disco vinculado ao ponto em que isso afeta o desempenho. Você saberá que este é o caso quando você não pode mais manter todas as suas CPUs saturadas (e você ainda tem RAM livre, ou alguns nós estão completamente ociosos esperando no disco).
Se o seu sistema de armazenamento atual tiver recursos de monitoramento de desempenho, você poderá observar suas estatísticas e planejar tomar medidas quando chegar a dizer 66% ou 75% dos valores máximos de desempenho, mas não há uma regra rígida que diga "X nós, tarefas Y - agora você precisa implantar o GPFS. "