O Micosoft HPC Pack 2012 R2 não é executado com o Network Direct após ingressar em novo domínio

2

Estou trabalhando com um cluster de 13 computadores, executado no Windows Server 2012 R2, usando o MS HPC Pack 2012 R2. O headnode está funcionando corretamente. Os servidores estão conectados à rede corporativa via IPv4 em adaptadores padrão. Os nós, no entanto, também estão conectados uns aos outros através do infiniBand.

Há uma semana, o cluster foi movido para um novo domínio, com os mesmos nomes de host. O FQDN mudou, é claro, e está se comportando corretamente na maioria das maneiras, exceto que o Network Direct agora está configurado como false em todos os 12 nós de computação.

Após a migração, o nó principal tinha todos os componentes HPC reinstalados. Os nós foram deixados intocados. Como achei que essa era a razão pela qual o Network Direct estava habilitado, também tentei reinstalar o HPC em um dos nós. Isso não resolveu o problema.

O Firewall do Windows está DESATIVADO em todos os níveis em todos os nós, incluindo o nó principal.

Em

  • adaptador ifiniBand no headnode: Adaptador IPoIB Mellanox ConnectX-3 Pro
  • Adaptador
  • inifiniBand nos nós: HP 10Gb / 40Gb 2 portas 544 + Adaptador IPoIB FLR-QSFP

Os servidores respondem às solicitações PING nos IPs definidos para os adaptadores infiniBand.

Alguém tem alguma ideia sobre isso? Agradecemos antecipadamente.

    
por Linus Waerner 11.03.2018 / 17:59

1 resposta

1

NICs Flash Mellanox em Etherent para que tudo funcione de forma confiável. InfiBand com o Windows é um tal PITA!

link

    
por 31.03.2018 / 22:13