Programação de trabalho não exclusivo em PBS / Torque

1

O gerenciador de recursos de cluster Torque geralmente aloca nós de computação em uma base exclusiva. No entanto, quando você tem muitos trabalhos pequenos (como nós) em execução nos nós de computação de vários núcleos, isso pode resultar em muitos recursos desperdiçados. Existe alguma maneira de configurar o Torque para permitir a alocação não exclusiva dos núcleos em um nó de computação?

(Esses trabalhos são todos embaraçosamente paralelos, portanto não estamos preocupados com a disputa pelo recurso de rede compartilhada. Não podemos alternar os agendadores, pois os scripts de trabalho de nossos clientes estão todos em PBS / Torque.)

    
por ajdecon 15.07.2011 / 22:13

1 resposta

1

OK, isso na verdade acabou sendo um problema com Maui. Estou jogando uma resposta aqui para que os outros não tenham que perder um dia. :)

Primeiro: faça com que seu arquivo Torque nodes liste os nós com argumentos np, ou seja, nodename np=8 . Isso garantirá que o gerenciador de recursos esteja ciente do número correto de processadores.

Segundo, para Maui: certifique-se de que seu arquivo maui.cfg inclua a linha NODEACCESSPOLICY SHARED . Então o agendamento não exclusivo deve funcionar.

    
por 15.07.2011 / 23:58