Verifique o uso de CPU / thread para um nó no gerenciador de tarefas do Slurm

2

Estou trabalhando em uma máquina de cluster que usa o gerenciador de tarefas do Slurm. Acabei de iniciar um código multithread e gostaria de verificar o uso de núcleo e thread para um determinado ID de nó. Por exemplo,

scoreusage -N 92512

foram "scoreusage" é o comando que eu não tenho certeza.

    
por Austin Downey 26.07.2017 / 20:08

1 resposta

0

Faz alguns anos desde que eu criei um cluster de slurm, mas squeue deveria dar o que você quer. Experimente:

squeue --nodelist 92512 -o "%A %j %C %J"

(que deve dar o seu jobid, jobname, cpus e threads para seus trabalhos no nó 92512)

BTW, a menos que você queira apenas detalhes específicos de um nó específico, talvez seja melhor procurar pelo ID do trabalho em vez do ID do nó.

Existem muitos sites bons com documentação sobre o uso de slurm disponíveis na web, facilmente encontrados no google - a maioria das universidades, etc. executando um cluster HPC, escrevem seus próprios documentos e ajudam e fazem cheat-sheets, personalizados para os detalhes seu (s) cluster (s) específico (então leve isso em conta e adapte quaisquer exemplos ao seu cluster). Há também uma boa documentação genérica sobre o uso de slurm no link

    
por 27.07.2017 / 03:57