Microsoft MPI não é possível conectar-se (o servidor RPC não está disponível).

1

Eu tenho duas máquinas com o MS MPI 7.1 instalado, uma chamada SERVER e uma chamada COMPUTE. As máquinas são configuradas na LAN em um simples grupo de trabalho do Windows (No DA) e ambas possuem uma conta com o mesmo nome e senha.

Ambos estão executando o serviço MSMPILaunchSvc. Ambas as máquinas podem executar tarefas MPI localmente, verificadas por testes com o comando hostname

SERVER> mpiexec -hosts 1 SERVER 1 hostname
SERVER
or
COMPUTE> mpiexec -hosts 1 COMPUTE 1 hostname
COMPUTE

em um terminal nas próprias máquinas.

Desativei o firewall nas duas máquinas para facilitar as coisas.

Meu problema é que não consigo MPI para executar trabalhos de SERVER em um host remoto:

1: SERVER com MSMPILaunchSvc - > COMPUTE com MSMPILaunchSvc

SERVER> mpiexec -hosts 1 COMPUTE 1 hostname -pwd
ERROR: Failed RpcCliCreateContext error 1722

Aborting: mpiexec on SERVER is unable to connect to the smpd service on COMPUTE:8677
Other MPI error, error stack:
connect failed - The RPC server is unavailable.  (errno 1722)

O que é ainda mais frustrante aqui é que só às vezes eu sou solicitado a digitar uma senha. Sugere SERVER \ Maarten como usuário para COMPUTE, a conta já estou logado como em SERVER e não deveria existir em COMPUTE (deveria ser COMPUTE \ Maarten então?). No entanto, também falha:

SERVER>mpiexec -hosts 1 COMPUTE 1 hostname.exe -pwd
Enter Password for SERVER\Maarten:
Save Credentials[y|n]? n
ERROR: Failed to connect to SMPD Manager Instance error 1726

Aborting: mpiexec on SERVER is unable to connect to the 
smpd manager on COMPUTE:50915 error 1726

2: COMPUTE com MSMPILaunchSvc - > SERVIDOR com MSMPILaunchSvc

COMPUTE> mpiexec -hosts 1 SERVER 1 hostname -pwd
ERROR: Failed RpcCliCreateContext error 5

Aborting: mpiexec on COMPUTE is unable to connect to the smpd service on SERVER:8677
Other MPI error, error stack:
connect failed - Access is denied.  (errno 5)

3: COMPUTE com MSMPILaunchSvc - > SERVIDOR com daemon smpd

 Aborting: mpiexec on COMPUTE is unable to connect to the smpd service on  SERVER:8677
Other MPI error, error stack:
connect failed - Access is denied.  (errno 5)

4: SERVER com MSMPILaunchSvc - > COMPUTE com o daemon smpd

ERROR: Failed to connect to SMPD Manager Instance error 1726

Aborting: mpiexec on SERVER is unable to connect to the smpd manager on 
COMPUTE:51022 error 1726
    
por Maarten 28.12.2016 / 17:26

1 resposta

1

Descobri, após tentativa e erro, que esses e outros erros inespecíficos surgem ao tentar executar o MS MPI com diferentes configurações (no meu caso, uma mistura de HPC Cluster 2008 e HPC Cluster 2012 com o MSMPI).

A solução foi fazer o downgrade de todos os nós para o Windows Server 2008 R2 com HPC Cluster 2008. Como não uso o AD, tive que voltar a usar o daemon do SMPD e adicionar regras de firewall para ele (ignorando as ferramentas de gerenciamento de cluster) .

    
por 02.01.2017 / 19:10