Estou projetando um nó principal cuja função principal é enviar tarefas para o agendador Torque / Maui e a função secundária é executar tarefas de teste. Infelizmente, a maioria dos guias de seleção de hardware para clusters foi escrita em 2000 a 2004 e é irrelevante nos dias de hoje. Consegui decidir facilmente a maioria das partes da configuração de hardware (por exemplo, NICs baseadas em interconexão), mas não entendo como escolher o disco rígido / memória / processadores.
HDDs: Como estou usando o armazenamento de rede, estou certo de que o tamanho / tipo (SSD vs spindle) do HDD pouco importa, pois eles precisam atender apenas aos requisitos de uma unidade de inicialização típica?
Memória: Supondo que os trabalhos de teste não consumam muita memória, existe alguma vantagem de desempenho em ter uma grande quantidade de memória no nó principal? O agendamento de tarefas não parece intensivo em memória. Se não, o que é uma regra prática para decidir quanto de memória preciso?
Processador: tirando os trabalhos de teste da equação, há alguma vantagem em ter mais núcleos ou freqüências de clock mais altas no processador? Eu imagino que esse agendamento de trabalho não é computacionalmente intensivo e dificilmente se beneficia de um processador mais rápido ou paralelismo.
Redundância: Como você evita que os nós principais sejam um SPOF? Por ter 2 ou mais nós principais? Deixo os nós da cabeça redundante completamente passivos (não utilizados) - caso contrário, imagino que será extremamente confuso tentar recuperar de um nó de cabeça morta? A heterogeneidade (especificações de hardware diferentes) é aceitável nos nós principais? Existe alguma necessidade de espelhamento RAID das unidades de inicialização nos nós principais?