qdel exclui todos os meus trabalhos

1

Estou usando o Sun GridEngine (Rocks Cluster) em um servidor para executar tarefas remotas.

Quando tento remover trabalhos com qdel , ele geralmente funciona como esperado, mas de vez em quando ele exclui quase tudo que encontra.

Por exemplo, em algum momento hoje eu tive 77 trabalhos em execução:

[znorg@server MD]$ qstat 
job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID 
-----------------------------------------------------------------------------------------------------------------
   7711 0.55500 shg_oAll_c znorg         dr    10/30/2012 13:49:07 [email protected]           1        
   7712 0.55500 shg_oCAB_c znorg         dr    10/30/2012 13:49:07 [email protected]           1        
   7873 0.55500 a1h3l_prdA znorg         r     11/08/2012 13:37:22 [email protected]            1        
   7874 0.55500 a1t8k_obsA znorg         r     11/08/2012 13:37:22 [email protected]           1        
   7875 0.55500 a1t8k_prdA znorg         r     11/08/2012 13:37:37 [email protected]           1        
   7877 0.55500 a3zr8_prdA znorg         r     11/08/2012 13:37:37 [email protected]           1        
   7878 0.55500 b1nez_obsA znorg         r     11/08/2012 13:37:52 [email protected]           1        
   7880 0.55500 b2j73_obsA znorg         r     11/08/2012 13:37:52 [email protected]           1        
(...)
   7955 0.55500 b2qcp_prdE znorg         r     11/08/2012 13:44:07 [email protected]           1        
   7956 0.55500 c3o2e_obsE znorg         r     11/08/2012 13:44:22 [email protected]           1        
   7960 0.55500 c3zzp_obsE znorg         r     11/08/2012 13:44:37 [email protected]           1        
   7995 0.55500 s1enh_prdA znorg         r     11/22/2012 16:06:24 [email protected]           1        
   7996 0.55500 s1igd_prdA znorg         r     11/22/2012 16:06:39 [email protected]           1        
   7997 0.55500 s1ixs_prdA znorg         r     11/22/2012 16:06:39 [email protected]           1        
(...)
   8008 0.55500 s1igd_prdD znorg         r     11/22/2012 16:07:39 [email protected]            1        
   8009 0.55500 s1ixs_prdD znorg         r     11/22/2012 16:07:39 [email protected]           1        
   8010 0.55500 s1shg_prdD znorg         r     11/22/2012 16:07:39 [email protected]           1        

Eu queria excluir os últimos 16 trabalhos, então eu digitei:

[znorg@server MD]$ qdel 7995 7996 7997 7998 7999 8000 8001 8002 8003 8004 8005 8006 8007 8008 8009 8010

Que retornou:

znorg has registered the job 7995 for deletion
znorg has registered the job 7996 for deletion
znorg has registered the job 7997 for deletion
znorg has registered the job 7998 for deletion
znorg has registered the job 7999 for deletion
znorg has registered the job 8000 for deletion
znorg has registered the job 8001 for deletion
znorg has registered the job 8002 for deletion
znorg has registered the job 8003 for deletion
znorg has registered the job 8004 for deletion
znorg has registered the job 8005 for deletion
znorg has registered the job 8006 for deletion
znorg has registered the job 8007 for deletion
znorg has registered the job 8008 for deletion
znorg has registered the job 8009 for deletion
znorg has registered the job 8010 for deletion

Até aí tudo bem, parece que está indo como esperado.

Mas quando eu verifiquei novamente, quase todos os outros trabalhos foram embora:

[znorg@server MD]$ qstat 
job-ID  prior   name       user         state submit/start at     queue                          slots ja-task-ID 
-----------------------------------------------------------------------------------------------------------------
   7712 0.55500 shg_oCAB_c znorg         dr    10/30/2012 13:49:07 [email protected]           1        
   7893 0.55500 a1t8k_prdB znorg         r     11/08/2012 13:39:07 [email protected]           1        
   7929 0.55500 a1t8k_prdD znorg         r     11/08/2012 13:42:07 [email protected]           1        

Estou fazendo algo errado? O que poderia estar acontecendo aqui?

    
por Znorg 22.11.2012 / 19:51

1 resposta

1

Parece que os trabalhos terminam. Não vejo nada de errado com o seu comando qdel . E pelos números que você recebe no final, parece que não é a ação qdel . Você pode conferir algumas informações de emprego por:

  qacct -o znorg -j Job-ID
    
por 24.07.2014 / 23:14