usando o topo para identificar o número do núcleo da cpu com qsub pbspro

0

Eu tenho um servidor de memória compartilhada com o PBSpro instalado como o gerenciador de tarefas. Existem 320 núcleos no total, e o pbs é configurado para que haja 1 fila de trabalhos com 30 dos 300 núcleos físicos de 32 cpu a serem divididos entre os usuários, com 2 cpus ou 20 núcleos restantes para a operação do nó principal.

algum software será executado ou paralelizado em mais de 100 núcleos, e eu gostaria de verificar se N processos do usuário A estão em números centrais únicos e separados do que os processos M do usuário B.

Se eu usar top , posso fazer

hit F to get into sort menu
hit J to sort by P = Last CPU used (SMP)

isso me dá uma coluna P na saída superior com um número central, mas em um sistema com 300 núcleos eu posso apenas obter 70-80 linhas antes de ficar sem tela, em um monitor de 1920x1200. Eu posso começar a encolher o tamanho da fonte na janela do terminal, mas no final eu não conseguirei ver até 300 linhas, nem que eu possa processar visualmente tudo isso com a atualização máxima a cada 1,3 segundos.

Meu objetivo é rapidez e facilidade

  • verificar se os usuários estão executando coisas na fila de tarefas dentro dos números principais corretos, e não no nó principal
  • verifique se há um núcleo de cpu em 100%, ou algo acima de 50%, que apenas um processo de um usuário está sendo executado nele. Eu quero ter certeza que se o usuário A com o programA.x estiver no núcleo # 234, o usuário B com anything.x NÃO está no núcleo # 234.

qual é a melhor maneira de fazer isso, quando um servidor de memória compartilhada de imagem única tem muitos núcleos?

    
por ron 28.03.2018 / 22:24

1 resposta

0

Você pode usar o ps com a opção personalizada e classificar os sinalizadores. Não tenho 100% de certeza sobre o tipo de filtragem que você quer da sua pergunta.

Então, talvez você queira me mostrar todos os processos. Eu quero ver a CPU em que estão, o nome de usuário e nome do processo. Ordenar por CPU

ps ax -o c,user,comm k c

O "ax" significa todos os processos, "-o c, user, comm" é o que colunas para exibir e "k c" significa classificar por CPU.

    
por 17.04.2018 / 13:44