Slurm: Como descobrir quanta memória não está alocada em um determinado nó

2

Eu sou novo no SLURM. Eu estou procurando por uma maneira confortável, para ver quantas memória em um nó / nodelist está disponível para minha alocação de srun.

Eu já brinquei com sinfo e scontrol e sstat, mas nenhum deles me dá a informação que eu preciso em uma visão geral confortável.

Eu tive a idéia de escrever um script de shell, a fim de buscar todos os campos de todos os jobs do scontrol e resumi-los. Mas deve haver um caminho mais fácil. Seria ótimo se alguém tivesse uma sugestão ou ideia!

    
por PlagTag 05.09.2013 / 18:04

1 resposta

2

A sétima coluna da saída de sinfo -N -l informará a quantidade de memória instalada em cada nó de cálculo.

$sinfo -N -l
Wed Nov  6 16:31:45 2013
NODELIST                NODES PARTITION       STATE CPUS    S:C:T MEMORY TMP_DISK WEIGHT FEATURES REASON              
node001                    1      Def*        idle    8    2:4:1  24150   920644    100 Xeon,X55 none  

O comando scontrol -o show nodes informará quanta memória já está em uso em cada nó. Procure a entrada AllocMem . (Needs Slurm 2.6.0 ou mais recente)

$ scontrol -o show nodes | awk '{ print $1, $13, $14}'
NodeName=node001 RealMemory=24150 AllocMem=0
    
por 06.11.2013 / 16:35