Mecanismo Sun Grid: finalizando automaticamente tarefas interativas inativas

1

Estamos pensando em usar o Sun Grid Engine em um pequeno cluster de computação. No momento, a configuração atual é bastante bruta e envolve apenas ter pessoas ssh em uma máquina aberta para executar seus trabalhos.

Gostaríamos de permitir trabalhos interativos, pois isso facilitaria a transição de iniciar trabalhos manualmente para iniciá-los usando qsub . Mas, há alguma preocupação de que, se o fizermos, as pessoas possam acidentalmente deixar suas sessões interativas ociosas e impedir que outros trabalhos sejam executados nas máquinas. A questão não é apenas teórica, uma vez que anteriormente tentamos usar o OpenPBS e havia um problema com pessoas abrindo um trabalho interativo em uma sessão de tela e, essencialmente, acampando em uma máquina.

Existe alguma maneira de configurar o SGE para matar automaticamente tarefas interativas ociosas? Parece que isso foi solicitado como um aprimoramento ( # # 2447 ) em 2007. Mas não parece que a solicitação tenha sido implementada.

    
por dmcer 13.04.2010 / 03:04

2 respostas

1

Você pode definir o SGE para ter um tempo de impressão padrão razoável (h_rt) para encerrar as sessões após um limite predefinido.

Já tentou obter o shell do usuário para tempo limite em ocioso? Mais informações e exemplos em link .

    
por 13.04.2010 / 05:30
1

nayrmil tem algumas boas sugestões. Outra opção seria limitar quais máquinas podem executar tarefas interativas. Basicamente, designamos alguns nós como "interativos" e colocamos uma fila neles que sobrecarrega os recursos do nó, para que muitos usuários possam efetuar login de uma só vez. Os usuários podem basicamente acampar lá por quanto tempo quiserem, mas se quiserem ter acesso a alguns recursos reais, precisam enviar um trabalho adequado.

    
por 13.04.2010 / 06:17