NICs Flash Mellanox em Etherent para que tudo funcione de forma confiável. InfiBand com o Windows é um tal PITA!
Estou trabalhando com um cluster de 13 computadores, executado no Windows Server 2012 R2, usando o MS HPC Pack 2012 R2. O headnode está funcionando corretamente. Os servidores estão conectados à rede corporativa via IPv4 em adaptadores padrão. Os nós, no entanto, também estão conectados uns aos outros através do infiniBand.
Há uma semana, o cluster foi movido para um novo domínio, com os mesmos nomes de host. O FQDN mudou, é claro, e está se comportando corretamente na maioria das maneiras, exceto que o Network Direct agora está configurado como false em todos os 12 nós de computação.
Após a migração, o nó principal tinha todos os componentes HPC reinstalados. Os nós foram deixados intocados. Como achei que essa era a razão pela qual o Network Direct estava habilitado, também tentei reinstalar o HPC em um dos nós. Isso não resolveu o problema.
O Firewall do Windows está DESATIVADO em todos os níveis em todos os nós, incluindo o nó principal.
Em
Os servidores respondem às solicitações PING nos IPs definidos para os adaptadores infiniBand.
Alguém tem alguma ideia sobre isso? Agradecemos antecipadamente.
NICs Flash Mellanox em Etherent para que tudo funcione de forma confiável. InfiBand com o Windows é um tal PITA!
Tags networking cluster hpc