Jobs do Sun Grid Engine (SGE) não visíveis após a adição de virtual_free

1

Estou tentando usar o virtual_free para limitar o número de tarefas de memória grande que executam cada nó da grade no meu cluster. Isso parece estar funcionando como esperado.

Depois que eu modifiquei meu código para enviar trabalhos com as instâncias de memória, qstat -f -q $ queueName não mostra mais uma lista de tarefas que estão esperando por um slot.

As tarefas são enviadas com uma fila específica (-q $ queueName).

Suponho que isso esteja acontecendo devido à mágica da seleção de filas do SGE. Existe uma maneira de fazer meus trabalhos aparecerem como antes?

Obrigado!

UPDATE

Estou usando:

qstat -f -u * -q $ queueName

para ver a fila. Se eu soltar o argumento da fila, posso ver os trabalhos. Se eu examinar um trabalho específico, posso ver que ele tem o conjunto de valores correto hard_queue_list.

Eu também estou usando o Sun Grid Engine 6.1u4

    
por Gary Richardson 15.11.2011 / 17:48

2 respostas

1

Os trabalhos estão solicitando uma fila. Eles não estão realmente na fila até que eles tenham iniciado a execução em um host que tenha uma instância dessa fila. Você só os verá na saída específica da fila se e quando eles realmente começarem a ser executados na fila solicitada. Isso faz todo o sentido se você considerar o fato de poder usar curingas em suas solicitações de fila.

    
por 16.11.2011 / 18:33
0

Se eles não aparecerem em qstat , eles não serão enviados ou já falharão, a mágica SGE para seleção de filas entra em ação depois que eles são enviados. Verifique também se qstat está relatando o usuário que enviou o trabalho!

Se você tiver trabalhos com restrições não atendidas, o SGE simplesmente fará fila até que eles estejam disponíveis.

    
por 15.11.2011 / 18:22

Tags