Perguntas sobre 'torque'

2
respostas

O trabalho de torque não entra no estado "E" (a menos que "qrun")

Trabalhos que eu adiciono à fila ficam lá no estado "Enfileirado" sem tentativas de serem executados (a menos que eu manualmente qrun deles) /var/spool/torque/server_logs diz apenas 04/11/2011 12:43:27;0100;PBS_Server;Job;16.localhos...
11.04.2011 / 12:06
1
resposta

qsub: Como posso descobrir qual middleware de DRM está exatamente instalado em um cluster?

Eu tenho uma conta de usuário em um cluster muito grande. Tenho experiência anterior com o Grid Engine e quero usar o cluster para tarefas de matriz. A documentação diz-me para usar "qsub" para balanceamento de carga / envio de muitos trabalh...
10.04.2012 / 10:41
0
respostas

O sistema de fila Torque pbs executa fila no sentido inverso

Eu tenho um pequeno cluster de computação configurado no Redhat 7.1. Ele executa o sistema de fila de torque PBS com a versão 5.1.1. Quando coloco vários trabalhos na fila, ele começa a executar os trabalhos na prioridade "para trás". Começa...
19.10.2016 / 08:21
0
respostas

Notificações por e-mail por JOB ARRAY não por tarefa no torque do PBS

Existe uma maneira de configurar o binário para enviar notificações por e-mail no início e no final do job array, e não por job, estou gerenciando job arrays de milhares de jobs e não quero ser inundado por emails. Mas, na verdade, quero saber q...
12.09.2013 / 01:44
2
respostas

O torque funciona na metade do tempo. Não Perde Sem Permissão a outra metade

Nós atualizamos nosso SO do Debian 5 para o Debian 6 e consequentemente atualizamos o Torque. Agora qstat e qsub funcionam por cerca de 1 minuto e falham por mais um minuto. Eu tenho torque-2.5.5 (mas eu tentei o 2.4.8 e ele teve os mesmos...
31.03.2011 / 03:31
1
resposta

Executando o código do tensorflow no trabalho de torque

Eu tenho um cluster rodando com torque para distribuir trabalhos. Eu quero executar um trabalho com código de tensorflow e estou tendo problemas com tensorflow não sendo reconhecido. Eu instalei o tensorflow no meu usuário LDAP usando o anaco...
05.10.2017 / 14:09
1
resposta

Por que o qdel comman retorna 'Unknown Job Id'?

Versão do sistema operacional: Kernel do CentOS release 4.6 (Final) em um \ m 2.6.9-100.ELsmp Problema Quando executo o qdel, recebo o seguinte erro: qdel: Unknown Job Id 20432.scyld.localdomain Informações Saída do qsta...
08.06.2013 / 09:44
1
resposta

Status do nó de torque e maui

Eu sou novo em torque e maui. Eu estava verificando o estado do nó para procurar quais nós estão livres e quais nós estão em uso. Para o comando de torque um é pbsnodes . Que fornece status e outras informações relacionadas ao nó. Qua...
05.01.2012 / 12:31
1
resposta

Programação de trabalho não exclusivo em PBS / Torque

O gerenciador de recursos de cluster Torque geralmente aloca nós de computação em uma base exclusiva. No entanto, quando você tem muitos trabalhos pequenos (como nós) em execução nos nós de computação de vários núcleos, isso pode resultar em mui...
15.07.2011 / 22:13
1
resposta

Job enviado para o Torque não gera arquivo de erro / log

Como dito, acabei de instalar o Torque em uma máquina Ubuntu 16.04. Os trabalhos enviados estão completos, mas as sinalizações -e e -o parecem não estar funcionando. Nenhum erro e arquivos de log são criados, mesmo que eu tenha dado a...
15.08.2017 / 12:04