OGE sem valor para load_avg

1

Existe um problema com a minha configuração do OGE. O load_avg para os nós não é definido (permanece em -NA-). Devido a isso e devido ao limite np_load_avg na fila, nenhuma tarefa está sendo executada.

[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
-------------------------------------------------------------------------------
node2                   -               -     -       -       -       -       -

Nenhum erro aparece no padrão / spool / localhost / messages nem no qmaster / messages. A mensagem de planejamento de fila é 'sem valor para o atributo complexo np_load_avg'.

Eu não vejo indicações sobre o que poderia estar errado, os seguintes trabalhos no nó de execução:

  • gethostname
  • gethostbyname master
  • qstat -f
  • loadcheck
por Adversus 09.09.2014 / 09:55

1 resposta

1

O problema estava no meu arquivo / etc / hosts, eu tinha:

127.0.0.1 node2

isso teve que se tornar:

10.0.0.2    node2

Finalmente me dando

[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME                ARCH         NCPU  LOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
-------------------------------------------------------------------------------
node2                   linux-x64       8  0.00   31.3G  308.8M   11.9G     0.0

e

[ce@node2 ce]# utilbin/linux-x64/gethostname 
Hostname: node2
Aliases:  
Host Address(es): 10.0.0.2 
    
por 09.09.2014 / 09:55