Existe uma maneira de verificar a utilização de recursos em um cluster executando o SLURM?

2

Não tenho certeza se essa pergunta se encaixa melhor aqui ou no Unix.SE, mas achei que é mais apropriado aqui. Eu estou executando algumas pesquisas pesadas de computação em um cluster nacional que usa o SLURM para agendar trabalhos.

Eu percebi que uma parte do meu script em lote (que cria um monte de processos filhos) está funcionando muito mais lentamente do que eu esperava e suspeito que há muitos segmentos sendo invocados pela ferramenta de análise que uso.

Eu estava esperando para verificar se há muitas opções de contexto, mas aparece como eu faria precisa do PID para verificar o número de opções de contexto . Verificar os processos por ps ou top não deu nenhum resultado para o nome da ferramenta em particular que estou executando, então eu suponho que os processos reais que são executados pelo meu script estão "ocultos" pelo SLURM em um diferente nível. Eu suponho que faz sentido, já que o computador real com o qual estou interagindo através do ssh, e o nó que realiza os cálculos não são os mesmos.

Mas existe uma maneira pela qual eu possa verificar coisas como utilização de CPU (por exemplo,% load) ou número de opções de contexto, a partir da linha de comando?

    
por posdef 21.07.2016 / 15:26

0 respostas