Depois de correr para isso eu mesmo, estranhamente ontem também. Eu perguntei a um desenvolvedor do módulo. Ele disse que deveria "apenas trabalhar" ... então, depois de jogar um pouco, eu encontrei o seguinte para trabalhar:
No host:
- cp conf.d / nvidia.pyconf /etc/ganglia/conf.d /
- cp graph.d / * /usr/share/ganglia-webfrontend/graph.d /
- Reinicie o gmond
No nó da GPU (Observe que esses são nomes e locais do pacote RHEL / SL / Cent):
- Instalar pip (python-pip)
- Executar: pip instale nvidia-ml-py
-
Da fonte:
cp conf.d/nvidia.pyconf /etc/ganglia/conf.d/ cp python_module/nvidia.py /usr/lib64/ganglia/
-
Reinicie o gmond
Não há necessidade de corrigir a web tree agora. Então, na interface da Web, vá para:
Grid > [name] > [gpu node]
Deve haver uma "métrica da gpu" na listagem agora. Pode querer entrar em colapso e olhar. Se não for por algum motivo, você pode ir para o Grid > Página [Nome] e, na parte inferior da lista suspensa Métrica, selecione uma das métricas gpu_ *. Isso pode chutar algo assim que você fizer isso. Tive que fazer isso para que um dos nós exibisse a seção "métricas da GPU" ... mas outra não.
YMMV.
-J