Perguntas sobre 'pbs'

0
respostas

torque pbs 4.0.1 o trabalho fica em estado de espera ('Q'); o agendador parece não receber nenhuma notificação

Estou usando o torque 4.0.1 no openSUSE 12.1 em um ambiente de cluster. Quando eu escrevo um job (simples como "echo hello"), ele permanece no estado 'Q' e nunca é agendado. Eu posso forçar o trabalho a executar com o qrun e ele é executado no p...
13.05.2012 / 14:15
2
respostas

Os trabalhos de leitura / gravação podem ser colocados em uma fila?

Eu compartilho um servidor com o HAL. O servidor tem 32 GB de memória. Eu raramente uso mais de 1 GB de memória, e quando faço isso é por alguns minutos de cada vez, e não me importo de enviar esses trabalhos para o final da linha. O HAL l...
11.10.2011 / 19:12
2
respostas

O trabalho de torque não entra no estado "E" (a menos que "qrun")

Trabalhos que eu adiciono à fila ficam lá no estado "Enfileirado" sem tentativas de serem executados (a menos que eu manualmente qrun deles) /var/spool/torque/server_logs diz apenas 04/11/2011 12:43:27;0100;PBS_Server;Job;16.localhos...
11.04.2011 / 12:06
1
resposta

PBS Jobs - trabalho paralelo em série vs que é melhor para meu cenário

Eu tenho acesso a um cluster que usa 'torque' (eu acho) e usamos scripts PBS para enviar trabalhos. Eu preciso executar mais de 200 instâncias de um aplicativo que desenvolvi em java. O aplicativo funciona como um peer formando uma rede P2P, o q...
08.10.2011 / 14:32
0
respostas

O sistema de fila Torque pbs executa fila no sentido inverso

Eu tenho um pequeno cluster de computação configurado no Redhat 7.1. Ele executa o sistema de fila de torque PBS com a versão 5.1.1. Quando coloco vários trabalhos na fila, ele começa a executar os trabalhos na prioridade "para trás". Começa...
19.10.2016 / 08:21
0
respostas

Notificações por e-mail por JOB ARRAY não por tarefa no torque do PBS

Existe uma maneira de configurar o binário para enviar notificações por e-mail no início e no final do job array, e não por job, estou gerenciando job arrays de milhares de jobs e não quero ser inundado por emails. Mas, na verdade, quero saber q...
12.09.2013 / 01:44
2
respostas

Como descobrir a versão do PBS instalada em um cluster?

Sempre que envio uma matriz de tarefas, obtenho uma ID de trabalho neste formulário: 463880-1.hostname com 463880 sendo a ID da tarefa e 1 a ID da matriz, uma tarefa para cada "posição da matriz". Hoje, estou usando uma máquina diferente e...
28.01.2014 / 18:25
1
resposta

Por que o qdel comman retorna 'Unknown Job Id'?

Versão do sistema operacional: Kernel do CentOS release 4.6 (Final) em um \ m 2.6.9-100.ELsmp Problema Quando executo o qdel, recebo o seguinte erro: qdel: Unknown Job Id 20432.scyld.localdomain Informações Saída do qsta...
08.06.2013 / 09:44
1
resposta

Programação de trabalho não exclusivo em PBS / Torque

O gerenciador de recursos de cluster Torque geralmente aloca nós de computação em uma base exclusiva. No entanto, quando você tem muitos trabalhos pequenos (como nós) em execução nos nós de computação de vários núcleos, isso pode resultar em mui...
15.07.2011 / 22:13
1
resposta

Job enviado para o Torque não gera arquivo de erro / log

Como dito, acabei de instalar o Torque em uma máquina Ubuntu 16.04. Os trabalhos enviados estão completos, mas as sinalizações -e e -o parecem não estar funcionando. Nenhum erro e arquivos de log são criados, mesmo que eu tenha dado a...
15.08.2017 / 12:04