Status da porta Infiniband UP mas não é possível abrir a porta UMAD ((null): 0)

1

Meu sistema tem dois dispositivos infiniband, um dos quais tem ambas as portas.

$> ibstatus
  Infiniband device 'mlx4_0' port 1 status:
         default gid:     fe80:0000:0000:0000:0002:c903:000f:0a9f
          base lid:        0x22
          sm lid:          0x1
          state:           4: ACTIVE
          phys state:      5: LinkUp
          rate:            20 Gb/sec (4X DDR)
          link_layer:      IB

  Infiniband device 'mlx4_0' port 2 status:
          default gid:     fe80:0000:0000:0000:0002:c903:000f:0aa0
          base lid:        0x23
          sm lid:          0x1
          state:           4: ACTIVE
          phys state:      5: LinkUp
          rate:            20 Gb/sec (4X DDR)
          link_layer:      IB

  Infiniband device 'mlx4_1' port 1 status:
          default gid:     fe80:0000:0000:0000:0002:c903:000f:0a6b
          base lid:        0x0
          sm lid:          0x0
          state:           1: DOWN
          phys state:      2: Polling
          rate:            10 Gb/sec (4X)
          link_layer:      IB

  Infiniband device 'mlx4_1' port 2 status:
          default gid:     fe80:0000:0000:0000:0002:c903:000f:0a6c
          base lid:        0xd
          sm lid:          0x2
          state:           4: ACTIVE
          phys state:      5: LinkUp
          rate:            10 Gb/sec (4X)
          link_layer:      IB

Agora, quando eu verificar o estado da porta ib pela tampa,

 $> ibportstate  -L 10x22 enable
 ibwarn: [14836] mad_rpc_open_port: can't open UMAD port ((null):0)
 ibportstate: iberror: failed: Failed to open '(null)' port '0'

Não tenho certeza sobre o motivo dessa mensagem de erro. Estou faltando alguma coisa?

    
por Sidjana 29.07.2013 / 05:57

2 respostas

2

O arquivo de dispositivo umad correspondente existe (normalmente é /dev/infiniband/umad0 )?

Além disso, no sistema ao qual tenho acesso, as permissões de /dev/infiniband/umad0 são definidas por padrão, de forma que os usuários normais não podem acessá-las:

crw-rw---- 1 root root 231, 0 Feb  1 16:00 /dev/infiniband/umad0

para que você possa usar sudo para executar seu comando (ou relaxar as permissões de /dev/infiniband/umad0 ).

    
por 12.02.2014 / 14:49
0

Talvez seja apenas um erro de digitação aqui no SO, mas você está especificando o LID como 10x22 . Como LID é suposto ser um número hexadecimal, o 1 é estranho. Deve ser apenas um 0x22 .

    
por 10.09.2015 / 22:59