systemimager e sistema de enfileiramento do motor de grade solar

1

Estou prestes a instalar nosso novo cluster. Eu instalei o primeiro nó e usei para golden-image. Como um software de enfileiramento, usamos SGE ( Sun Grid Engine ). Após a instalação do primeiro nó, testei o envio com qsub e a leitura das estatísticas da fila com qstat . Funcionou como esperado. No entanto, após a clonagem para outro nó, o SGE não está funcionando. Não consigo iniciar o daemon. Se eu tentar qstat -f eventualmente depois de mais tempo, vejo a mensagem:

"error: unable to send message to qmaster using port 535 on host "myHOST": got send timeout*"

Não sei de onde vem, pois as configurações /etc/services e firewall são as mesmas nos dois hosts. Outra coisa é que o diretório de spool para o novo nó não foi criado (isso pode ser entendido).

Alguém pode me aconselhar como instalar SGE usando systemimager sem dores desnecessárias. Eu não gostaria de passar por todos os nós de computação para iniciar ./install_execd

    
por Kris_R 10.07.2012 / 13:16

0 respostas