Perguntas sobre 'slurm'

1
resposta

Verifique o uso de CPU / thread para um nó no gerenciador de tarefas do Slurm

Estou trabalhando em uma máquina de cluster que usa o gerenciador de tarefas do Slurm. Acabei de iniciar um código multithread e gostaria de verificar o uso de núcleo e thread para um determinado ID de nó. Por exemplo, scoreusage -N 92512...
26.07.2017 / 20:08
1
resposta

Insira automaticamente “yes” no arquivo bash [closed]

Slurm é o gerenciador de carga de trabalho. Existem dois tipos de modos para executar o trabalho, o modo interativo (srun) e em lote (sbatch). Ao usar o modo interativo, é necessário deixar o terminal aberto, o que pode sobrecarregar o termin...
24.08.2017 / 17:04
2
respostas

Como listar todos os processos atribuídos a um usuário em um cluster

Temos um cluster em nossa universidade controlado pelo SLURM. A questão é que observei algumas vezes que alguns dos recursos não estão sendo percebidos, mesmo que eles não apareçam no comando squeue . Por exemplo, vi que muitas CPUs em um dos...
05.09.2018 / 10:35
1
resposta

Enviando lista de tarefas para slurm

Eu tenho um grande número de scripts que podem ser executados como trabalhos separados em um cluster de computação, que usa slurm. Eu quero selecionar alguns deles, com base no conteúdo, para enviar. É fácil identificar os nomes de arquivos dos...
14.04.2017 / 19:40
2
respostas

Processamento de texto - Criando um arquivo slurm topology.conf na saída ibnetdiscover

Primeiras coisas primeiro: nenhum conhecimento de slurm ou Infiniband é necessário - este é um problema puramente de processamento de texto. Em segundo lugar - eu estou ciente de ib2slurm - o código está de alguma forma quebrado e possivelmen...
15.01.2016 / 08:08
1
resposta

Como enviar um trabalho para um nó específico usando o comando sbatch do Slurm?

Nossos nós são denominados node001 ... node0xx em nosso cluster. Gostaria de saber se é possível enviar um trabalho para um nó específico usando o comando sbatch do Slurm? Se assim for, alguém pode postar um código de exemplo para isso?...
12.05.2018 / 20:29
0
respostas

SLURM: restringir o acesso da GPU apenas ao SLURM

Eu tenho uma única máquina (Ubuntu 16.04 Server) com 4 GPUs TitanX. Esta será uma máquina de laboratório na qual os alunos aprenderão sobre o CUDA e outras coisas. Eu instalei SLURM porque eu quero uma ferramenta para agendar e enfileirar trabal...
13.04.2018 / 19:24
0
respostas

Como aumentar o limite de memória e o número de núcleos que o Rstudio usa em um cluster

Eu lancei Rstudio usando FastX em Rivanna cluster ( CentOS Linux release 7.3.1611 (Core) ): link O principal objetivo para isso foi aumentar significativamente a velocidade de cálculos e o limite de memória, no entanto, quando...
23.12.2017 / 23:25
0
respostas

xvfb-run abortando no cluster

Estou tentando executar um script python com xvfb-run em um cluster usando o SLURM; quando eu uso uma sessão interativa ( srun ) funciona bem, mas ao enviar para uma fila ( sbatch ) ela aborta / falha sem muita informação. /usr/bin/xvf...
30.08.2014 / 22:04
1
resposta

A melhor maneira de cancelar todos os jobs do SLURM a partir da saída do comando shell

Enviei vários scripts de tarefas do SLURM com limite de tempo de depuração (esqueci de alterar a hora da execução real). Agora todos eles são enviados ao mesmo tempo, então todos começam com o ID do trabalho 197xxxxx. Agora eu posso fazer squ...
16.01.2018 / 07:18